誰來為AI解答疫情下人類異常行為數據的疑惑

作者:劉俊寰

你還記得,半年前,你打開淘寶,是在看衣服?化妝品?還是準備換一個手機殼?

疫情打亂了人們的生活計劃,隨著年初疫情逐漸升溫,各大電商平臺的口罩上架后往往秒售罄,有人也因此養(yǎng)成了囤貨的習慣。

當疫情向國外擴散,這個變化也在歐美各國開始出現??偛课挥趥惗氐淖稍児綨ozzle專門為亞馬遜賣家做算法廣告,他們敏銳地注意到了這個變化,疫情之前,手機殼、充電器、樂高在亞馬遜銷售榜上從來沒有跌出過前十,但如今,這些在短短幾天內就被擠出榜單,取而代之的是口罩、消毒液等。

他們還繪制了疫情相關產品的變化曲線圖:

4月12日至18日,亞馬遜網站上的十大搜索詞分別是:衛(wèi)生紙、口罩、口罩、洗手液、紙巾、來蘇爾噴霧劑、科樂士濕巾、口罩、來蘇爾、防菌口罩和N95口罩。

從這些商品內容也可以追蹤新冠病毒的傳播軌跡,相關商品的銷售量在意大利率先達到峰值,其次是西班牙、法國、加拿大和美國,英國和德國緊隨其后。

“短短幾天時間就發(fā)生了如此不可思議的轉變。”Nozzle的CEO Rael Cline說道。這種漣漪效應在整個零售供應鏈中也現出真身,同時,AI也受到了影響,在庫存管理、欺詐檢測、營銷等算法中已經出現了造成了“打嗝”(hiccups)現象,也就是說,如今,以正常人類行為為基礎的機器學習模型已經不能適應社會的變化了。

根據全球AI咨詢公司Pactera Edge,“自動化正在走下坡路”,一些工作人員表示,他們正在謹慎地關注著那些硬撐著的自動系統(tǒng),以便在需要的時候介入人工修正。

從疫情中,也可以看出,我們的生活與AI交織得多么緊密,但也暴露出了一種微妙的依賴關系,我們的行為改變會改變AI的工作方式,而AI的工作方式的改變,反過來會再次影響到我們的行為。

“當身處這樣與往常不同的環(huán)境時,你永遠不能坐而忘之。”Cline說。

世界變了,數據也會變

最開始,機器模型的設計就是為了應對變化,但即使是現在,大多數模型仍然相當脆弱,尤其當輸入數據與訓練過的數據差距過大,它們的表現就會很糟糕。Pactera Edge副總裁Rajeev Sharma表示,你以為在建立一個AI系統(tǒng)后就能一走了之?這是錯誤的做法,“AI是一個有生命的、會呼吸的系統(tǒng)”。

根據Sharma與幾家公司的交流結果,不少公司因AI無法及時得到修正正在苦苦掙扎。

一家向印度零售商供應醬料和調味品的公司表示,此前公司一直依靠AI的預測準備訂購庫存,目前銷售預測與實際銷售情況存在較大出入。當這種情況發(fā)生,自動庫存管理系統(tǒng)就亟需被修復,但“AI從未經過這樣極端的訓練”。

在新聞領域,也發(fā)生了相關問題。一家新聞網站使用AI評估文章情感偏向,再根據結果提供每日投資建議,但目前新聞比平時都更陰沉,AI給出的建議偏差也較大。

機器模型出現問題很大原因在于,越來越多的企業(yè)雖然購入了相關系統(tǒng),但缺乏維護系統(tǒng)所需的內部知識,而如果想要重新培訓一個模型,可能需要專家級的人員重新建設。

當前的危機下,即使是與訓練集中的最壞情況相比,現實隨時都有可能變得更糟糕。

在Sharma看來,要訓練更多AI,除此之外,訓練內容應該包括過去的“怪胎事件”,比如20世紀30年代經濟大蕭條、1987年黑色星期一股市暴跌、2008年金融危機,“這些大災變是建立更好的機器學習模型的基礎”。

但即便如此,也很難做到萬全準備。一般來說,如果機器學習系統(tǒng)沒有看到它所期望看到的東西,那么就會出現問題。

用AI檢測信用卡詐騙的行為分析公司Featurespace創(chuàng)始人David Excell表示,令人驚訝的是,Featurespace沒有看到自家AI系統(tǒng)受到太大打擊,在他們看來,人們仍然像以前那樣在亞馬遜上買東西、訂閱Netflix,不過,人們不再購買大件商品,也不在新地方消費,這些行為還是足以引起懷疑。

Excell說,公司的工程師們只需要介入調整,以應對購買園藝設備和電動工具的人激增的情況,這些屬于欺詐檢測算法可能會發(fā)現的那種中間價格異常的購買行為。

“世界變了,數據也變了。”Excell說。

AI亟需修正,亞馬遜也逃不出這個命運

倫敦的Phrasee正在動手修改他們的AI系統(tǒng),該公司使用自然語言處理和機器學習技術代表客戶生成電子郵件營銷文案或Facebook廣告,保證文案語氣的正確是工作中相當重要的一部分。在工作時,AI能生成大量短語,通過神經網絡運行后挑選出最佳結果。

但是,鑒于生成的語言可能出錯,在平時,Phrasee也保持讓人類來檢查其輸入和輸出的習慣。疫情爆發(fā)后,Phrasee意識到,在語言的使用上需要比平時更敏感準確,于是他們開始著手過濾額外語言,禁止了一些特定的短語如“going viral”,不允許涉及被叫停的活動如“party wear”,甚至刪除了可能會被解讀為高興或驚險的表情符號,以及可能引發(fā)焦慮的詞,如“OMG”“be prepared”“stock up”“brace yourself”等。

然而,作為整個零售行業(yè)的一個小小的分支,很多企業(yè)無法與亞馬遜抗衡,但這也是最微妙的地方。隨著亞馬遜和其250萬第三方賣家努力滿足市場需求,亞馬遜正對其算法進行細微的調整,以幫助分擔賣家的負擔。

畢竟,大多數亞馬遜上的第三方賣家都是依靠亞馬遜的算法創(chuàng)造收入,賣家將商品存放在亞馬遜倉庫里,亞馬遜負責所有的物流,包括送貨到家、處理退貨等。交易完成后,亞馬遜會推廣完成訂單的賣家。

例如,你在亞馬遜上搜索Switch后,頂部顯眼的“添加到購物籃”按鈕旁邊的結果更有可能是使用亞馬遜物流的供應商,否則就會被排到更后面的位置。


但在過去幾周里,亞馬遜上這一情況出現了180度扭轉,為了緩解庫存壓力,亞馬遜的算法現在似乎更傾向于推廣能自己發(fā)貨的賣家。

市場動蕩,人為干預不可少

如果沒有人工干預,要實現這種調整是很難的,“情況太不穩(wěn)定了,上周算法工程師還在努力優(yōu)化衛(wèi)生紙,這周大家突然就都想買拼圖或健身器材了”。

亞馬遜對算法進行的調整隨后影響到在線廣告上的投入,這些算法決定花在廣告上的金額取決于無數變量,但最終決定是基于用戶對其有多少價值的估計,這其中,有許多方法可以預測客戶的行為,包括有關過去購買的數據,以及廣告公司根據不同人的在線活動進行的推薦。

但是現在,Cline說,想要預測點擊廣告的人是否會購買產品,最佳的參考因素之一就是送達時間,這也是Nozzle在和客戶討論調整算法時提出的意見。例如,如果你認為你不能比競爭對手更快地交付產品,那么想在廣告拍賣中超過他們,所進行的花費可能就是無效的。

這一切只有專業(yè)團隊才能做到。Cline認為,目前的情況讓很多人大開眼界,很多人以為自動化系統(tǒng)都可以自己運行,“但實際上,你需要一個數據科學團隊,從而把社會事件和算法事件聯系起來。一個算法永遠也不會主動挑選出這些東西”。

現在已經步入了萬物相連的時代,從疫情中已經可以廣泛地感受到,這也觸動了在更典型的時代仍然隱藏著的機制。如果要尋找一線生機,那么現在正是時候對新暴露出來的系統(tǒng)進行盤點,同時弄清楚如何設計得更好,使系統(tǒng)更有彈性。

如果要信任機器,我們就需要對它們進行監(jiān)督。

【本文是51CTO專欄機構大數據文摘的原創(chuàng)譯文,微信公眾號“大數據文摘(id: BigDataDigest)”】

(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )

贊助商
2020-05-28
誰來為AI解答疫情下人類異常行為數據的疑惑
作者:劉俊寰你還記得,半年前,你打開淘寶,是在看衣服?

長按掃碼 閱讀全文