當(dāng)你們?cè)谟盟惴ǐ@取流量和金錢(qián)時(shí),微博和知乎是這樣做的

摘要:昨天,我的一條微博創(chuàng)造了自2010年注冊(cè)以來(lái)的記錄:閱讀量超過(guò)1000萬(wàn),且還在繼續(xù)增長(zhǎng)——然而我的微博粉絲,卻只有1萬(wàn)人,出現(xiàn)這樣的情況,是因?yàn)槲⒉┑腡imeline不再只是基于關(guān)注,而是結(jié)合了算法

昨天,我的一條微博創(chuàng)造了自2010年注冊(cè)以來(lái)的記錄:閱讀量超過(guò)1000萬(wàn),且還在繼續(xù)增長(zhǎng)——然而我的微博粉絲,卻只有1萬(wàn)人,出現(xiàn)這樣的情況,是因?yàn)槲⒉┑腡imeline不再只是基于關(guān)注,而是結(jié)合了算法推薦的“發(fā)現(xiàn)流”,每一個(gè)內(nèi)容都有被算法推薦進(jìn)而曝光和爆發(fā)的機(jī)會(huì),坐擁千萬(wàn)粉絲大V和只有一萬(wàn)粉絲的小V,都要PK內(nèi)容。事實(shí)上,整個(gè)行業(yè),算法都在扮演著日趨重要的角色。

內(nèi)容平臺(tái)的算法經(jīng)濟(jì)學(xué)

微博在2017年先是加入了發(fā)現(xiàn)流,內(nèi)容分發(fā)邏輯發(fā)生巨大變化,正是因?yàn)榭吹搅怂惴?lèi)內(nèi)容平臺(tái)的強(qiáng)勢(shì)崛起——微博,百度、UC、騰訊、搜狐、網(wǎng)易都推出了信息流產(chǎn)品,知乎2017年改版首頁(yè)從基于關(guān)注的內(nèi)容推薦,變?yōu)榛谒惴ê完P(guān)注的內(nèi)容推薦。

將算法用在內(nèi)容推薦上,國(guó)內(nèi)的先行者是豆瓣——它在PC時(shí)代首頁(yè)就已是基于算法推薦而形成的內(nèi)容流,豆瓣FM、豆瓣閱讀等產(chǎn)品背后的邏輯也是算法。然而,彼時(shí)深度學(xué)習(xí)技術(shù)并不成熟,豆瓣的推薦精準(zhǔn)度一直被豆友們吐槽。近年來(lái),隨著AI技術(shù)的成熟,算法也越來(lái)越得心應(yīng)手,真正意義上實(shí)現(xiàn)了千人千面,比用戶更理解用戶,不斷吞噬用戶時(shí)間。

結(jié)合算法,精準(zhǔn)的廣告也被不斷推薦給用戶,成了移動(dòng)互聯(lián)網(wǎng)商業(yè)化的最佳答案,比如微博就通過(guò)信息流廣告賺得缽滿盆滿,2017年總營(yíng)收達(dá)到77.13億元,同比增長(zhǎng)76%,凈利潤(rùn)則達(dá)到27.14億元。此外,百度、知乎等平臺(tái)也都在發(fā)力信息流廣告,算法正在帶來(lái)真金白銀。

當(dāng)然,算法不是靈丹妙藥,它一直被業(yè)界批評(píng)缺乏必要的正向價(jià)值觀、有導(dǎo)致用戶閱讀視野變窄的“信息繭房效應(yīng)”,容易形成信息孤島,甚至導(dǎo)致低俗泛濫。不過(guò),現(xiàn)在看來(lái),通過(guò)與價(jià)值觀、與人、與社交的融合,算法正在規(guī)避上述問(wèn)題,甚至一定程度上成了內(nèi)容業(yè)的看門(mén)狗。

算法成為內(nèi)容平臺(tái)看門(mén)狗

新聞從業(yè)者一直被視作是社會(huì)的“看門(mén)狗”——守護(hù)安全,監(jiān)督環(huán)境,警惕危險(xiǎn),現(xiàn)在看來(lái)算法在內(nèi)容平臺(tái)上也開(kāi)始扮演“看門(mén)狗”的角色:內(nèi)容質(zhì)量、內(nèi)容審核、社區(qū)治理,算法都能幫上大忙。

上周末,微信屏蔽抖音的消息被傳開(kāi),不過(guò)騰訊公關(guān)總監(jiān)張軍日前回應(yīng),“朋友圈一直有防刷屏機(jī)制,過(guò)了閥值就自動(dòng)不可見(jiàn),過(guò)凌晨12點(diǎn)自動(dòng)恢復(fù)正常,屏蔽之說(shuō)不存在?!备饲靶率老嗟日T導(dǎo)分享的賣(mài)課被屏蔽一樣,微信正在將算法用在平臺(tái)的治理上,事實(shí)上,公眾號(hào)內(nèi)容原創(chuàng)識(shí)別,朋友圈關(guān)鍵字屏蔽等等功能背后,都是算法在驅(qū)動(dòng)。

今年1月,微博官方賬號(hào)@微博管理員發(fā)布《關(guān)于加大力度處理熱搜榜熱門(mén)話題榜刷榜行為的公告》,對(duì)王樂(lè)樂(lè)微博等涉嫌參與刷榜的大V進(jìn)行了處罰。微博宣稱(chēng)其“不斷對(duì)產(chǎn)品本身進(jìn)行算法升級(jí)并設(shè)置了以大數(shù)據(jù)識(shí)別為基礎(chǔ)的防刷體系。對(duì)于存在作弊特征的行為,系統(tǒng)都會(huì)實(shí)時(shí)進(jìn)行識(shí)別和攔截。在熱搜榜中,每天約有40%的熱搜詞被系統(tǒng)識(shí)別為流量異常而不能上榜?!贝送馕⒉┮矊⑺惴☉?yīng)用在內(nèi)容審核等方面,相信大家對(duì)此心照不宣。

另一個(gè)受關(guān)注的內(nèi)容平臺(tái)知乎也一直很重視社區(qū)氛圍,對(duì)社區(qū)的管理采用的是名為“瓦力”和“悟空”的AI反垃圾系統(tǒng)。知乎日前升級(jí)了瓦力的算法,可以實(shí)時(shí)篩查對(duì)內(nèi)容創(chuàng)作者不友善的內(nèi)容,或是對(duì)答非所問(wèn)、事實(shí)錯(cuò)誤、垃圾廣告導(dǎo)流等行為進(jìn)行識(shí)別和處理。知乎站務(wù)管理賬號(hào)“知乎小管家”公布的數(shù)據(jù)是,瓦力每日可處理內(nèi)容近萬(wàn)條,對(duì)于舉報(bào)上來(lái)的不友善內(nèi)容,0.3秒內(nèi)就可以處理掉。

算法已成為行業(yè)標(biāo)配,不只是內(nèi)容平臺(tái),就連電商平臺(tái)也在應(yīng)用算法來(lái)推薦商品。不過(guò),算法的價(jià)值不只是流量、時(shí)長(zhǎng)或者變現(xiàn),從一些內(nèi)容平臺(tái)的實(shí)踐來(lái)看,算法可以比肉眼更加精準(zhǔn)地識(shí)別不好的內(nèi)容,為優(yōu)質(zhì)內(nèi)容保駕護(hù)航,進(jìn)而避免劣幣驅(qū)逐良幣,也一定程度規(guī)避了算法推薦的缺陷。

微博通過(guò)算法來(lái)確保熱搜榜的權(quán)威價(jià)值。熱搜榜和熱門(mén)話題榜能夠快速、準(zhǔn)確反映出微博用戶對(duì)于熱點(diǎn)內(nèi)容的關(guān)注程度和方向,對(duì)于不同角色都有其參考價(jià)值,然而一旦被“注水”這個(gè)榜單就失去了意義。正是因?yàn)榇耍⒉┮粩嗌?jí)算法,來(lái)抗擊刷榜大軍。

知乎也在通過(guò)算法確保社區(qū)內(nèi)容品質(zhì)。相對(duì)于微信的生活化和微博的大雜燴而言,品質(zhì)對(duì)于“中文互聯(lián)網(wǎng)內(nèi)容高地”知乎更重要。許多內(nèi)容在知乎討論后會(huì)被以鏈接、截圖、日?qǐng)?bào)等形似分享到微博微信,之前看到過(guò)一組數(shù)據(jù),每天知乎有近50萬(wàn)條內(nèi)容被分享到站外,二次傳播瀏覽人數(shù)達(dá)到2億,而且許多大事件比如最近的六六京東事件、藍(lán)標(biāo)員工事件,知乎的討論在事件中都是重要一環(huán)。知乎在面向大眾人群的同時(shí),依然需要注重內(nèi)容品質(zhì)。過(guò)去這一保障依靠人,現(xiàn)在也靠算法,據(jù)官方數(shù)據(jù)來(lái)看,知乎今年3月的月PV達(dá)到了230億,差不多是去年同期的2.3倍。

在內(nèi)容大爆炸的時(shí)代,優(yōu)質(zhì)內(nèi)容反而是稀缺的,將算法應(yīng)用到優(yōu)質(zhì)內(nèi)容守護(hù)上就顯得尤為重要。而長(zhǎng)期來(lái)看,當(dāng)一套算法系統(tǒng)成為“看門(mén)狗”后,它就可以不斷被訓(xùn)練,不斷自我學(xué)習(xí),進(jìn)而變得愈發(fā)聰明,可以在后臺(tái)24小時(shí)不間斷運(yùn)轉(zhuǎn),不給“壞內(nèi)容”任何可乘之機(jī),也節(jié)省了大量的人力成本,內(nèi)容審核和社區(qū)管理人員將會(huì)越來(lái)越多地被算法取代。

算法要如何做好看門(mén)狗?

用算法來(lái)管理內(nèi)容和社區(qū)對(duì)于業(yè)界來(lái)說(shuō),還是一個(gè)新的命題。先行者微博、知乎等平臺(tái)的做法,也給行業(yè)提供了一些思路。

1、人機(jī)結(jié)合,不能只靠算法。

1月底,微博被相關(guān)部門(mén)約談后,將熱搜榜、熱門(mén)話題榜、微博問(wèn)答等功能下線一周,經(jīng)過(guò)整改后上線。微博副總裁曹增輝向界面透露,整改的核心是:

“引入了編輯人工干預(yù)的模式,微博會(huì)將算法挖掘作為基礎(chǔ),在排序和選擇上放棄純粹算法的方式,引入編輯對(duì)違反有關(guān)法律法規(guī)的內(nèi)容、社會(huì)負(fù)能量的信息、過(guò)度娛樂(lè)化的信息進(jìn)行人工干預(yù)?!?/p>

人機(jī)結(jié)合是未來(lái)算法應(yīng)用的趨勢(shì),因?yàn)樗惴ㄟ€沒(méi)有智能到可以全部取代人類(lèi)的程度,而且算法缺乏人類(lèi)才具備的價(jià)值觀。對(duì)于社區(qū)內(nèi)容管理而言,也只有人機(jī)結(jié)合,才能避免誤傷優(yōu)質(zhì)內(nèi)容和正常用戶,形成公平的治理環(huán)境,比如知乎的瓦力機(jī)器人,對(duì)于網(wǎng)友們舉報(bào)的不友善內(nèi)容,先通過(guò)算法智能識(shí)別,再引入管理員人工核查,大大提升了處理效率和準(zhǔn)確率,也節(jié)省了人力成本,算法也會(huì)學(xué)習(xí)用戶的舉報(bào)內(nèi)容特點(diǎn),進(jìn)行模型分析,提升識(shí)別的準(zhǔn)確率和覆蓋范圍。

2、眾包機(jī)制,用戶自治管理。

知乎前段時(shí)間面向5萬(wàn)用戶內(nèi)測(cè)了“有理由反對(duì)”功能,用戶可以選擇「事實(shí)錯(cuò)誤」、「答非所問(wèn)」、「煽動(dòng)情緒」和「不解釋」等理由,知乎瓦力根據(jù)用戶信用值權(quán)重來(lái)判斷這個(gè)選擇的重要性,最終體現(xiàn)在對(duì)內(nèi)容的分發(fā)上。而據(jù)“知乎小管家”專(zhuān)欄介紹,知乎用戶平均每天舉報(bào)各類(lèi)違規(guī)內(nèi)容約兩萬(wàn)五千條,其中 2%來(lái)自作者舉報(bào)自己內(nèi)容評(píng)論區(qū)的違規(guī)行為,剩下 98% 來(lái)自其他用戶看到違規(guī)行為的舉報(bào),用戶的舉報(bào)準(zhǔn)確度高達(dá) 95%。微博則在最近上線了一個(gè)很有意思的功能:云黑名單。當(dāng)一個(gè)用戶因?yàn)闊嶂杂谥櫫R等行為被多個(gè)用戶舉報(bào)或者拉黑后,就會(huì)被加入云黑名單,此后,這個(gè)用戶的評(píng)論可能只有自己才看得到。這個(gè)做法的本質(zhì)就是讓用戶來(lái)管理用戶,或者說(shuō)叫做用戶自治。

理論上來(lái)說(shuō),眾包機(jī)制,同樣是一種人機(jī)結(jié)合,只不過(guò)它將用戶變成了協(xié)管,引入了眾人的價(jià)值觀,同時(shí)引入算法,來(lái)形成一種中心式+去中心的多元化管理制度。長(zhǎng)期來(lái)看,此舉可以讓用戶體會(huì)到更加民主公平的社區(qū)氛圍,也更愿意遵守和維護(hù)社區(qū)秩序,變相成為社區(qū)兼職管理員。

3、社區(qū)規(guī)則,奠定算法基礎(chǔ)。

微博很早就上線了《新浪微博社區(qū)公約》和一些社區(qū)規(guī)則,并一直在完善這個(gè)體系,它主要對(duì)用戶的內(nèi)容發(fā)布、評(píng)論互動(dòng)等等行為進(jìn)行了規(guī)約,此后不論是微博管理員,還是不斷迭代的算法,在處理問(wèn)題時(shí),都要遵照這個(gè)公約,它堪稱(chēng)是微博這個(gè)社區(qū)的“憲法”。知乎上的類(lèi)似條款則是《知乎協(xié)議》和《知乎社區(qū)管理規(guī)定》,2014年知乎為了營(yíng)造更好的討論環(huán)境發(fā)布了《良性討論公約》,不論是瓦力機(jī)器人還是知乎管理員,同樣是在這些約定框架下運(yùn)轉(zhuǎn)的。當(dāng)然,規(guī)則也應(yīng)該根據(jù)社區(qū)成長(zhǎng),不斷迭代完善,成為社區(qū)管理的準(zhǔn)繩。

4、預(yù)防預(yù)測(cè),而非事后清理。

曾經(jīng),社區(qū)管理更多是在做事后處理,比如對(duì)違規(guī)內(nèi)容的刪除屏蔽,對(duì)對(duì)應(yīng)用戶的扣分禁言等等,不過(guò),隨著算法在社區(qū)管理的中的應(yīng)用,平臺(tái)結(jié)合大數(shù)據(jù),已經(jīng)有能力來(lái)預(yù)測(cè)一個(gè)用戶的行為,在其產(chǎn)生影響前就進(jìn)行干預(yù)。比如當(dāng)你上傳一張圖片后,微博首先就會(huì)進(jìn)行相似度判斷,涉嫌違規(guī)的突破,相似度90%以上的系統(tǒng)直接處理,相似度50%-90%的就有人工審核;再比如一個(gè)用戶,是比較喜歡惡意攻擊的“網(wǎng)絡(luò)暴民”,其內(nèi)容就很可能會(huì)被限流,甚至只有他自己可見(jiàn)。

在算法成為互聯(lián)網(wǎng)行業(yè)的顯學(xué)后,各個(gè)平臺(tái)都在應(yīng)用算法?,F(xiàn)在看來(lái)行業(yè)不應(yīng)該只是關(guān)注如何用算法來(lái)獲取更多流量時(shí)長(zhǎng),或者提高廣告轉(zhuǎn)化率,同時(shí)也要更重視將算法應(yīng)用在平臺(tái)治理上,同時(shí)結(jié)合社區(qū)眾包管理等機(jī)制,來(lái)提升算法治理的效率和效果,用算法來(lái)規(guī)避算法的缺陷。從目前各家平臺(tái)的實(shí)踐來(lái)看,大家要學(xué)的東西,還有很多,“在未來(lái)面前,我們還是個(gè)孩子”。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2018-03-28
當(dāng)你們?cè)谟盟惴ǐ@取流量和金錢(qián)時(shí),微博和知乎是這樣做的
摘要:昨天,我的一條微博創(chuàng)造了自2010年注冊(cè)以來(lái)的記錄:閱讀量超過(guò)1000萬(wàn),且還在繼續(xù)增長(zhǎng)——然而我的微博粉絲,卻只有1萬(wàn)人,出現(xiàn)這樣的情況,是因?yàn)槲⒉┑腡imeline不再只是基于關(guān)注,而是結(jié)合

長(zhǎng)按掃碼 閱讀全文