當前位置:首頁 > 大白菜資訊 > 阿里AI技術升級,輕松識別攔截近30個語種外語臟話圖
阿里AI技術升級,輕松識別攔截近30個語種外語臟話圖
日期:2021-09-28 | 時間:11:44
早在一年前,阿里巴巴就發現了一些為規避平臺審查的“臟話”的做法,一般開始是文字形式的臟話,后面逐漸演變為臟話圖片,后面甚至使用多國語言進行偽裝。
而這些做法使得阿里巴巴,無法通過現有技術和規則,進行識別和清除,因此阿里安全開始進行多語種識別技術升級。
最近,阿里安全算法團隊宣布了一個好消息,表示網絡臟話的AI(OCR)技術研發升級,可以識別近30種語言,即使是嵌入圖片中的臟話,也可以進行識別。
之所以要進行這這類技術的研發,是因為在部分國際平臺中,“買家”在商品評論以及一些交互場景中,使用臟話圖片對陣。
而這部分臟話圖片中,還包含了多語種垃圾廣告以及不良信息,具有較大的威脅。
但是,全球有幾百種語言,即使是重點的語言也有幾十種,所以人工識別風險圖片一點也不現實的,所以這項技術的需求就很大了。
在研發的過程中,除了要熟悉各字體的信息之外,還要注意部分臟話圖會以置換正常字符順序的方法,試圖瞞天過海。
現在,經過一年多努力研究,阿里安全算法團隊總算是得到了一個好結果,可以更加好地攔截危險圖片,確保安全。