“凈網(wǎng)2019”行動(dòng)即將開(kāi)始,企業(yè)如何做好內(nèi)容安全?

近日,全國(guó)“掃黃打非”辦公室為貫徹落實(shí)2019年“掃黃打非”專項(xiàng)行動(dòng),從3月起開(kāi)始大力組織開(kāi)展“凈網(wǎng)2019”、“護(hù)苗2019”、“秋風(fēng)2019”等專項(xiàng)行動(dòng),持續(xù)凈化社會(huì)文化環(huán)境。

“凈網(wǎng)2019”行動(dòng)即將開(kāi)始,企業(yè)如何做好內(nèi)容安全?

值得關(guān)注的是,本次線上“掃黃打非”工作,將重點(diǎn)整治對(duì)象瞄準(zhǔn)了包括自媒體、文學(xué)、直播以及學(xué)習(xí)類APP等場(chǎng)景。豐富大眾娛樂(lè)生活的直播 APP 快速發(fā)展,衍生出了眾多全新內(nèi)容平臺(tái),別有用心者嗅到機(jī)會(huì),開(kāi)始散播色情、暴力等“網(wǎng)絡(luò)垃圾”。此外,互聯(lián)網(wǎng)流量的不斷增加,也使得互聯(lián)網(wǎng)“掃黃打非”工作難度不斷升級(jí)。面對(duì)此次國(guó)家新一輪的凈網(wǎng)行動(dòng)號(hào)召,直播 APP 等內(nèi)容平臺(tái)何去何從?

梳理互聯(lián)網(wǎng)“掃黃打非”的歷程,不難發(fā)現(xiàn)出現(xiàn)了三次顯著的技術(shù)對(duì)抗更迭:

1. 互聯(lián)網(wǎng)起步階段,互聯(lián)網(wǎng)鑒黃主要走“人肉攻略”,人工完成圖片鑒定工作;

2. 隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)絡(luò)數(shù)據(jù)量驟增,以膚色識(shí)別算法過(guò)濾“黃色”圖片成為了主流手段,機(jī)器鑒黃與人工鑒黃相互配合;

3.如今,到了移動(dòng)互聯(lián)網(wǎng)階段,網(wǎng)絡(luò)數(shù)據(jù)再次驟增,人工鑒黃已經(jīng)很難適應(yīng)如今的工作量,加上視頻、直播等業(yè)務(wù)的暴漲,純靠膚色識(shí)別算法作為“過(guò)濾”的方式,已經(jīng)過(guò)時(shí)。

好在人工智能的適時(shí)出現(xiàn),通過(guò)深度學(xué)習(xí)匹配處理龐大的數(shù)據(jù)信息。

特征提取+智能識(shí)別,掃蕩“音視圖文”的黑暗角落

針對(duì)藏匿在互聯(lián)網(wǎng)“音視圖文”中的不良內(nèi)容,騰訊云天御對(duì)色情、暴力、敏感等非法內(nèi)容中提取的特征,配合騰訊多年的內(nèi)容安全經(jīng)驗(yàn),針對(duì)不同形式的違規(guī)內(nèi)容,打造了一整套的高效識(shí)別引擎模塊。

首先,面對(duì)圖片內(nèi)容會(huì)有相似度識(shí)別通過(guò)與過(guò)往的數(shù)據(jù)內(nèi)容相比,判斷該圖片是否屬于違法范圍。如果命中將會(huì)給予客戶攔截的建議,否則將送到后續(xù)的智能識(shí)別模塊識(shí)別色情、暴力、敏感等非法內(nèi)容。

針對(duì)視頻內(nèi)容,騰訊云天御會(huì)根據(jù)一定頻率截取視頻圖片,得到視頻按幀記錄的圖片庫(kù)。去掉重復(fù)的和模糊的,提取關(guān)鍵因素的圖片送到產(chǎn)品后臺(tái)系統(tǒng)。之后對(duì)其采用圖片識(shí)別模塊的操作,對(duì)其視頻內(nèi)容進(jìn)行判斷。

此外,在面對(duì)文本內(nèi)容信息時(shí),騰訊云天御通過(guò)智能模型處理系統(tǒng),對(duì)其包含的內(nèi)容做檢測(cè),識(shí)別其中是否包含色情、暴力、敏感等違法要素,給予迅速地?cái)r截。

除了能夠檢測(cè)正常文本之外,還配置了強(qiáng)大的文本預(yù)處理系統(tǒng)對(duì)抗非法分子創(chuàng)造的惡意文本,有效地打擊了非法分子的惡意文本傳播行為,建立一個(gè)健康的檢測(cè)模型。

AI 正視聽(tīng),毫秒級(jí)識(shí)別不良音頻

道高一尺,魔高一丈。除了常見(jiàn)的圖片、視頻、文本等形式外,音頻如今也成了垃圾內(nèi)容的“主戰(zhàn)場(chǎng)”。

當(dāng)下,游戲內(nèi)語(yǔ)音交流已成常態(tài),無(wú)論是手機(jī)游戲中的音頻傳輸,還是通過(guò)語(yǔ)音及時(shí)通訊工具傳輸?shù)囊纛l內(nèi)容,都是音頻垃圾內(nèi)容的災(zāi)區(qū)。此外,在直播平臺(tái)直播過(guò)程中,也有違規(guī)音頻內(nèi)容的傳播、傳遞,制造網(wǎng)絡(luò)垃圾。

音頻內(nèi)容往往時(shí)間短或是信道復(fù)雜等問(wèn)題,難以分辨,隱隱成為當(dāng)下“掃黃打非”的難點(diǎn)。

騰訊云天御語(yǔ)音識(shí)別模塊能夠?qū)φZ(yǔ)音進(jìn)行音頻分類和種子庫(kù)匹配等方式來(lái)過(guò)濾惡意音頻,同時(shí)還通過(guò)音轉(zhuǎn)文技術(shù)對(duì)樣本庫(kù)進(jìn)行更新,達(dá)到精確識(shí)別語(yǔ)音的目的。

在具體技術(shù)上,騰訊云天御采用了高效的 i-vector 系統(tǒng)保證較長(zhǎng)音頻正確快速檢出,同時(shí)對(duì)信息量不足的短音頻采用 DNN embedding 系統(tǒng)進(jìn)行特定檢出,兩者互為補(bǔ)充,加上多種信道補(bǔ)償算法的融合,同時(shí)保證了系統(tǒng)的識(shí)別性能和識(shí)別效果。

基于變長(zhǎng)統(tǒng)計(jì)和深度學(xué)習(xí)混合的鑒黃系統(tǒng),騰訊云天御可以做到0.02秒能夠識(shí)別1秒的音頻。

權(quán)威認(rèn)證 騰訊云天御守衛(wèi)您的內(nèi)容安全

騰訊云天御針對(duì)互聯(lián)網(wǎng)不良內(nèi)容的體系化識(shí)別能力,也獲得了國(guó)家的認(rèn)可。2019年1月16日,在由中國(guó)信息通信研究院指導(dǎo),云計(jì)算標(biāo)準(zhǔn)和開(kāi)源推進(jìn)委員會(huì)承辦,云計(jì)算開(kāi)源產(chǎn)業(yè)聯(lián)盟支持的"嚴(yán)守紅線,共筑安全-內(nèi)容安全的管與控"的云計(jì)算安全沙龍上,中國(guó)信息通信研究院發(fā)布了國(guó)內(nèi)首批內(nèi)容安全解決方案評(píng)估成果,騰訊云成為首批通過(guò)試點(diǎn)評(píng)估測(cè)試的企業(yè)。

“凈網(wǎng)2019”行動(dòng)即將開(kāi)始,企業(yè)如何做好內(nèi)容安全?

目前,騰訊云天御已在多個(gè)行業(yè)被應(yīng)用,守護(hù)近萬(wàn)家客戶的內(nèi)容安全,保障業(yè)務(wù)健康開(kāi)展,守衛(wèi)互聯(lián)網(wǎng)的一片凈土。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2019-03-01
“凈網(wǎng)2019”行動(dòng)即將開(kāi)始,企業(yè)如何做好內(nèi)容安全?
近日,全國(guó)“掃黃打非”辦公室為貫徹落實(shí)2019年“掃黃打非”專項(xiàng)行動(dòng),從3月起開(kāi)始大力組織開(kāi)展“凈網(wǎng)

長(zhǎng)按掃碼 閱讀全文