“今日頭條將強(qiáng)化總編輯責(zé)任制,全面糾正算法和機(jī)器審核的缺陷,不斷強(qiáng)化人工運(yùn)營(yíng)和審核,將現(xiàn)有6000人的運(yùn)營(yíng)審核隊(duì)伍,擴(kuò)大到10000人?!?月11日早4時(shí)33分,今日頭條創(chuàng)始人&CEO張一鳴在其《致歉和反思》信中說(shuō)。
作為國(guó)內(nèi)最大的智能內(nèi)容平臺(tái),今日頭條一直以機(jī)器學(xué)習(xí)推薦技術(shù)引以為傲。此次大幅度擴(kuò)充運(yùn)營(yíng)審核團(tuán)隊(duì),或許是認(rèn)為,以機(jī)器學(xué)習(xí)為主導(dǎo)的機(jī)制,已無(wú)法負(fù)荷龐大的內(nèi)容審核工作,需要加大人工輔助力度了。
指控、處罰、責(zé)令關(guān)閉內(nèi)涵段子,今日頭條整改行動(dòng)從本月正式開(kāi)始
早從今年3月開(kāi)始,用戶可能或多或少的有所感覺(jué),甚至提出疑問(wèn):包含低俗、違法、虛假等內(nèi)容的今日頭條,是不是快要不行了?
3月8日,央視財(cái)經(jīng)發(fā)布《“今日頭條”終于上了“頭條”!無(wú)視監(jiān)管,竟做起這種“黑勾當(dāng)”!害苦2.4億用戶...》文章,直指“今日頭條”利用“二跳”手段發(fā)布虛假?gòu)V告,嚴(yán)重侵害消費(fèi)者合法權(quán)益,并危害到相關(guān)藥品企業(yè)正常經(jīng)營(yíng);
3月29日央視《經(jīng)濟(jì)半小時(shí)》欄目直接指出,今日頭條枉顧監(jiān)管約談,明著合法,暗中“二跳”廣告的“黑勾當(dāng)”;
3月30日,就廣告違規(guī)問(wèn)題,北京工商行政管理局海淀分局對(duì)今日頭條行政作出處罰,沒(méi)收廣告費(fèi)并處以廣告費(fèi)用3倍罰款,總計(jì)達(dá)94.4萬(wàn)元人民幣;
4月4日,國(guó)家廣播電視總局對(duì)今日頭條、快手兩家網(wǎng)站的主要負(fù)責(zé)人進(jìn)行了約談,要求全面整改;
4月9日,多家應(yīng)用商店下架今日頭條APP,暫停其下載服務(wù)3周,時(shí)間從4月9日15時(shí)起至4月30日15時(shí)止;
4月10日,國(guó)家廣播電視總局責(zé)令今日頭條永久關(guān)?!皟?nèi)涵段子”。當(dāng)晚,今日頭條關(guān)?!皟?nèi)涵段子”。
近一個(gè)月的時(shí)間,央視及國(guó)家相關(guān)監(jiān)管部門接連不斷的的指責(zé),幾乎在大眾面前將今日頭條批的體無(wú)完膚。為此,今日頭條方面承諾,將把4月作為整改月,全面清查產(chǎn)品中存在的問(wèn)題,并定期向監(jiān)管部門匯報(bào)整改進(jìn)度,向公眾同步整改結(jié)果。
依靠機(jī)器學(xué)習(xí)推薦機(jī)制,今日頭條僅用6年便成為國(guó)內(nèi)最大的智能內(nèi)容平臺(tái)
從2012年發(fā)布第一個(gè)版本至今,今日頭條僅用不到6年的時(shí)間,便發(fā)展成為了國(guó)內(nèi)最大的智能內(nèi)容平臺(tái)。相關(guān)數(shù)據(jù)統(tǒng)計(jì),截至2017年7月31日,今日頭條的日活躍用戶數(shù)已經(jīng)達(dá)到了1.2億,較2016年同期翻了一倍多。
眾所周知,機(jī)器學(xué)習(xí)推薦機(jī)制是今日頭條最大功臣??v觀今日頭條推薦的結(jié)果看,其智能算法大致走了以下幾大流程:
一、數(shù)據(jù)抓取,從用戶在該平臺(tái)的瀏覽動(dòng)態(tài)或其他賬號(hào)日常動(dòng)態(tài)中抓取相關(guān)數(shù)據(jù)。
二、用戶分析,每個(gè)用戶都是一個(gè)數(shù)據(jù)庫(kù),信息瀏覽行為越多,其數(shù)據(jù)庫(kù)中的數(shù)據(jù)也越多。智能算法會(huì)對(duì)這些數(shù)據(jù)進(jìn)行整合與分析,從而提煉出該數(shù)據(jù)庫(kù)的關(guān)鍵詞。
三、內(nèi)容審核,智能算法主要做了兩件事,消重和審核。
消重,就是辨別內(nèi)容相似度,以避免推薦給用戶的內(nèi)容過(guò)于重復(fù)。顯然,這一點(diǎn),今日頭條做的并不好,用戶經(jīng)常會(huì)看到相似內(nèi)容,甚至標(biāo)題、圖片等都很相似;
審核方面,這是今日頭條被嚴(yán)厲指責(zé)的關(guān)鍵問(wèn)題所在。因算法尚未成熟,人工干預(yù)度低,導(dǎo)致很多未經(jīng)人工審核的將色情、低俗、虛假、違法等內(nèi)容通過(guò)了審核。
四、新聞推薦,這是與用戶直接關(guān)聯(lián)的一步。從今日頭條的推薦機(jī)制看,內(nèi)容會(huì)被推薦與否,與熱點(diǎn)、點(diǎn)擊量直接掛鉤。這是智能算法對(duì)內(nèi)容受歡迎程度的一次判斷。
但顯然,今日頭條這一內(nèi)容平臺(tái),并沒(méi)有很好的做到其所期望的。
雖加大人工審核力度,機(jī)器學(xué)習(xí)推薦內(nèi)容依舊是大勢(shì)所趨
“3月29日央視報(bào)道我們的廣告問(wèn)題后,我不斷反思自己以前的想法,反思公司現(xiàn)在的做法,開(kāi)始大力推進(jìn)公司員工提高意識(shí)、改進(jìn)管理、完善流程?!边@是張一鳴的反思之一。
而隨后的行動(dòng),就是“強(qiáng)化人工運(yùn)營(yíng)和審核,將現(xiàn)有6000人的運(yùn)營(yíng)審核隊(duì)伍,擴(kuò)大到10000人?!?/p>
顯然,今日頭條這個(gè)人工智能內(nèi)容平臺(tái),已經(jīng)認(rèn)識(shí)到機(jī)器學(xué)習(xí)的不足,開(kāi)始更為重視人工了。對(duì)此,有網(wǎng)友提出質(zhì)疑,從人工到人工智能是進(jìn)步,從機(jī)器回到人工,這是歷史和科技的倒退?
去年11月,張一鳴在2017今日頭條創(chuàng)作者大會(huì)上透露,其頭條號(hào)賬號(hào)總數(shù)超120萬(wàn),平均每天發(fā)布50萬(wàn)條內(nèi)容,創(chuàng)造內(nèi)容消費(fèi)達(dá)48億次。
以每個(gè)賬號(hào)每天投稿5條內(nèi)容算,頭條好每天的投稿內(nèi)容達(dá)600萬(wàn)條。除此之外,今日頭條旗下還有悟空問(wèn)答、微頭條、西瓜/火山/抖音以及已經(jīng)關(guān)停的內(nèi)涵段子。該平臺(tái)每天的投稿、上傳內(nèi)容超4000萬(wàn)。
僅靠1萬(wàn)的人工,顯然是無(wú)法完全負(fù)荷審核任務(wù)的。僅從目前來(lái)說(shuō),今日頭條的審核推薦機(jī)制,依舊以機(jī)器學(xué)習(xí)算法為主導(dǎo),并加以大量人工輔助。
其實(shí),除了今日頭條,新浪微博、微信公眾號(hào)、快手短視頻、界面等平臺(tái)也有相關(guān)的機(jī)器學(xué)習(xí)審核算法的加持。如新浪微博,其會(huì)實(shí)時(shí)更新關(guān)鍵詞,如果用戶發(fā)布的內(nèi)容涉及到相關(guān)關(guān)鍵詞,就會(huì)被屏蔽或刪除。
而微信公眾號(hào)作為現(xiàn)今流量排前的內(nèi)容平臺(tái),其在內(nèi)容審核方面則較為嚴(yán)謹(jǐn)。有過(guò)運(yùn)營(yíng)經(jīng)歷的人應(yīng)該經(jīng)常碰到,一旦提交審核的內(nèi)容中提及了一些敏感內(nèi)容或詞匯,其審核時(shí)間就會(huì)非常得長(zhǎng)。
很顯然,在平臺(tái)多元、領(lǐng)域多樣、數(shù)量越來(lái)越龐大的情況下,通過(guò)機(jī)器學(xué)習(xí)審核推薦內(nèi)容是大勢(shì)所趨。僅靠人工,非得累死。
不過(guò),當(dāng)前的機(jī)器學(xué)習(xí)算法能工作質(zhì)量,還遠(yuǎn)不及人類,否則,今日頭條也就不會(huì)陷入如此窘境了。就像扎克伯格曾經(jīng)說(shuō)的一樣,F(xiàn)acebook對(duì)人工智能非常依賴,希望能夠通過(guò)AI改善審核機(jī)制。但想要完全依靠AI審核內(nèi)容,可能還需要5-10年的時(shí)間。
機(jī)器學(xué)習(xí)算法作為每一次內(nèi)容低劣指控的“背鍋俠”,需要的,可能只是時(shí)間和耐心。在沒(méi)有完全成熟之前,可以是主導(dǎo),但絕不可以是唯一。技術(shù)提升加以人工輔助,是對(duì)用戶最大的負(fù)責(zé)。
“我是工程師出身,創(chuàng)業(yè)的初心是希望做一款產(chǎn)品,方便全世界用戶互動(dòng)和交流。因此,在過(guò)去幾年間,今日頭條將更多的精力和資源,放在了企業(yè)的增長(zhǎng)上。現(xiàn)在,我們必須重新梳理我們的愿景,保證所‘創(chuàng)作’與‘交流’的內(nèi)容是積極向上的、健康有益的,能夠給時(shí)代、給人民帶來(lái)正能量?!睆堃圾Q說(shuō)的似乎很誠(chéng)懇。
最后
快手的創(chuàng)始人&CEO宿華曾表示,技術(shù)讓每個(gè)人前所未有的得到了表達(dá)自我的機(jī)會(huì),但也帶了新的社會(huì)問(wèn)題。因?yàn)閹浊陙?lái),人們所適應(yīng)的,是由人呈現(xiàn)出來(lái)的世界。我們需要去適應(yīng)新的世界。
當(dāng)然,這里不得不提一句,機(jī)器學(xué)習(xí)算法是在抓取用戶“行為數(shù)據(jù)庫(kù)關(guān)鍵詞”之后才進(jìn)行的推薦。如果,你能抵制住低俗內(nèi)容的誘惑,又怎會(huì)被這些內(nèi)容推薦“干擾”?
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )