AI制造的垃圾正在污染我們的文化

大量人工智能生成的內(nèi)容充斥網(wǎng)絡(luò),不僅影響網(wǎng)絡(luò)環(huán)境,更滲透到科學(xué)研究、社交媒體、新聞媒體等領(lǐng)域,對人類文化造成負面影響,亟需采取措施加以管制。

越來越多的合成AI生成的內(nèi)容充斥著我們的信息流和搜索結(jié)果。這些問題的嚴(yán)重性遠遠超出了我們的屏幕。整個文化都受到了AI的溢出效應(yīng)影響,這種影響正悄然侵蝕我們最重要的機構(gòu)。

以科學(xué)為例。在OpenAI發(fā)布的最新人工智能模型GPT-4之后,科學(xué)研究的語言開始發(fā)生變化。尤其是在AI領(lǐng)域本身。本月發(fā)表的一項研究考察了多個知名科學(xué)會議上研究AI的科學(xué)家的同行評審——這些評審是科學(xué)研究進展的基石——在這些會議上,同行評審中使用“細致”一詞的頻率是前一年的34倍以上。使用“值得稱贊”的頻率大約是10倍,“復(fù)雜”則是11倍。其他大型會議也顯示出類似的模式。

這些短語當(dāng)然是現(xiàn)代大型語言模型(如ChatGPT)的最愛。換句話說,大量AI會議上的研究人員被發(fā)現(xiàn)將他們的同行評審工作交給了AI——或者至少是在AI的大量幫助下撰寫。而且,提交的評審越是臨近截止日期,其中發(fā)現(xiàn)的AI使用就越多。

如果這讓你感到不適——尤其是考慮到AI目前的不可靠性——或者你認為應(yīng)該由科學(xué)家而不是AI來評審科學(xué),這些感受突顯了這項技術(shù)核心的悖論:在欺詐和常規(guī)使用之間的道德界限并不清楚。一些AI生成的欺詐很容易識別,就像一篇醫(yī)學(xué)期刊論文中出現(xiàn)的卡通老鼠,其生殖器官異常巨大。許多其他欺詐則更為隱蔽,就像同一篇論文中描述的錯誤標(biāo)記和幻覺般的調(diào)控途徑——這篇論文也經(jīng)過了同行評審(也許,有人可能會推測,是由另一個AI評審的?)。

當(dāng)AI以預(yù)期的方式被使用——協(xié)助寫作時,又會發(fā)生什么?最近,當(dāng)人們發(fā)現(xiàn)簡單的科學(xué)數(shù)據(jù)庫搜索返回了像“作為一個AI語言模型”這樣的短語,這是因為依賴AI的作者忘記了掩蓋他們的蹤跡。如果這些作者簡單地刪除了這些意外的水印,他們使用AI來寫論文是否就可以接受?

科學(xué)領(lǐng)域正在發(fā)生的事情只是一個更大問題的縮影。在社交媒體上發(fā)帖?現(xiàn)在任何關(guān)于X的熱門帖子幾乎肯定包含了AI生成的回復(fù),從對原始帖子的總結(jié)到用ChatGPT那種平淡無奇的維基百科式語氣寫出的反應(yīng),都是為了吸引關(guān)注。Instagram上充斥著AI生成的模特,Spotify上有AI生成的歌曲。出版一本書?之后不久,在亞馬遜上通常會出售聲稱與你的書配套的AI生成的“工作簿”(它們的內(nèi)容是錯誤的;我知道這一點,因為這也發(fā)生在我身上)。谷歌搜索的頂部結(jié)果現(xiàn)在經(jīng)常是AI生成的圖像或文章。像《體育畫報》這樣的主要媒體已經(jīng)開始創(chuàng)建AI生成的文章,歸功于同樣虛假的作者檔案。銷售搜索引擎優(yōu)化方法的營銷人員公開吹噓使用AI創(chuàng)建數(shù)千篇垃圾文章,以從競爭對手那里竊取流量。

然后是生成性AI日益增長的使用,用于擴大YouTube上兒童合成視頻的制作規(guī)模。一些輸出的例子是洛夫克拉夫特式恐怖,比如關(guān)于鸚鵡的音樂視頻,其中鳥類有眼睛中的眼睛,喙中的喙,形態(tài)不可理解地變化,用人工聲音唱著,“樹上的鸚鵡說你好,你好!”敘述沒有意義,角色隨機出現(xiàn)和消失,基本事實(如形狀的名稱)都是錯誤的。在我發(fā)現(xiàn)我的通訊《內(nèi)在視角》上許多這樣的可疑頻道后,《連線》雜志發(fā)現(xiàn)了一些擁有數(shù)十萬甚至數(shù)百萬訂閱者的賬戶在生產(chǎn)流程中使用生成性AI的證據(jù)。

作為一名神經(jīng)科學(xué)家,這讓我感到擔(dān)憂。難道人類文化中不包含認知微量營養(yǎng)素——像連貫的句子、敘述和角色連貫性這樣的東西——發(fā)展中的大腦需要嗎?愛因斯坦據(jù)說曾說過:“如果你想讓你的孩子聰明,就給他們讀童話故事。如果你想讓他們非常聰明,就給他們讀更多的童話故事?!钡?,當(dāng)一個幼兒主要消費AI生成的夢想垃圾時,會發(fā)生什么?我們發(fā)現(xiàn)自己正處于一個巨大的發(fā)展實驗之中。

現(xiàn)在互聯(lián)網(wǎng)上有如此多的合成垃圾,以至于AI公司和研究人員自己也感到擔(dān)憂,他們擔(dān)心的不是文化的健康狀況,而是他們的模型將會發(fā)生什么。隨著AI能力在2022年的提升,我寫過關(guān)于文化變得如此泛濫于AI創(chuàng)作,以至于當(dāng)未來的AI被訓(xùn)練時,之前的AI輸出將滲透到訓(xùn)練集中,導(dǎo)致未來的復(fù)制品的復(fù)制品的復(fù)制品,因為內(nèi)容變得越來越刻板和可預(yù)測。2023年,研究人員引入了一個技術(shù)術(shù)語來描述這種風(fēng)險如何影響AI訓(xùn)練:模型崩潰。在某種程度上,我們和這些公司處于同一條船上,劃著同一股污泥流入我們的文化海洋。

帶著這種不愉快的比喻,值得看看我們當(dāng)前情況的最清晰的類比:環(huán)境運動和氣候變化。正如公司和個人被不可阻擋的經(jīng)濟學(xué)驅(qū)動去污染一樣,AI的文化污染也是由理性的決定驅(qū)動的,以盡可能便宜的方式填補互聯(lián)網(wǎng)對內(nèi)容的貪婪需求。雖然環(huán)境問題遠未解決,但已經(jīng)取得了不可否認的進展,使我們的城市基本上沒有霧霾,我們的湖泊基本上沒有污水。這是怎么做到的?

在任何具體政策解決方案之前,是承認環(huán)境污染是一個需要外部立法解決的問題。對這一觀點產(chǎn)生影響的是1968年由生物學(xué)家和生態(tài)學(xué)家加勒特·哈丁提出的觀點。哈丁博士強調(diào),污染問題是由人們?yōu)榱俗约旱睦嫘惺峦苿拥模虼恕爸灰覀冎幌癃毩⒌?、理性的、自由企業(yè)者那樣行事,我們就鎖定在一個‘弄臟自己的巢’的系統(tǒng)中?!彼麑栴}總結(jié)為“公地悲劇”。這種框架對環(huán)境運動起到了推動作用,該運動依靠政府監(jiān)管來完成公司單獨或不愿意做的事情。

我們再次發(fā)現(xiàn)自己在上演一場公地悲劇:短期經(jīng)濟自利鼓勵使用廉價的AI內(nèi)容來最大化點擊和觀看,這反過來又污染了我們的文化,甚至削弱了我們對現(xiàn)實的把握。到目前為止,主要的AI公司拒絕采取先進的方法來識別AI的作品——他們可以通過在單詞使用或圖像像素中隱藏微妙的統(tǒng)計模式來做到這一點。

不采取行動的一個常見理由是,如果知道足夠多,人類編輯總可以調(diào)整任何使用的模式。然而,我們正在經(jīng)歷的許多問題并不是由有動機和技術(shù)熟練的惡意行為者引起的;它們主要是由普通用戶不遵守幾乎不存在的道德使用界限所引起的。大多數(shù)人對將統(tǒng)計模式納入輸出的先進對策不感興趣,理想情況下,這些輸出應(yīng)該標(biāo)明它們是由AI生成的。

這就是為什么獨立研究人員能夠以驚人的高準(zhǔn)確率在同行評審系統(tǒng)中檢測到AI輸出:他們真的嘗試了。同樣,現(xiàn)在全國的老師們已經(jīng)創(chuàng)建了自制的輸出側(cè)檢測方法,比如在只有復(fù)制粘貼時才會出現(xiàn)的論文提示中添加隱藏的單詞使用模式請求。

特別是,AI公司似乎反對任何可以提高AI檢測努力合理水平的內(nèi)置模式,也許是因為他們擔(dān)心,執(zhí)行這些模式可能會通過限制輸出太多而干擾模型的性能——盡管目前沒有證據(jù)表明這是風(fēng)險。盡管公開承諾要開發(fā)更先進的水印技術(shù),但越來越清楚的是,公司之所以拖延,是因為對于AI行業(yè)來說,擁有可檢測的產(chǎn)品是違背其底線的。

為了應(yīng)對這種企業(yè)的拒絕行動,我們需要相當(dāng)于《清潔空氣法》的東西:《清潔互聯(lián)網(wǎng)法》。也許最簡單的解決方案將是立法強制生成的輸出內(nèi)在的高級水印,比如不容易移除的模式。就像20世紀(jì)需要廣泛的干預(yù)來保護共享環(huán)境一樣,21世紀(jì)將需要廣泛的干預(yù)來保護一個不同的、但同樣關(guān)鍵的共同資源,一個我們直到現(xiàn)在才注意到的共同資源,因為它從未受到威脅:我們共享的人類文化。

本文譯自 The New York Times,由 BALI 編輯發(fā)布。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2024-04-04
AI制造的垃圾正在污染我們的文化
大量人工智能生成的內(nèi)容充斥網(wǎng)絡(luò),不僅影響網(wǎng)絡(luò)環(huán)境,更滲透到科學(xué)研究、社交媒體、新聞媒體等領(lǐng)域,對人類文化造成負面影響,亟需采取措施加以管制。 越來越多的合成AI生成的內(nèi)容充斥著我們的信息流和搜索結(jié)果。

長按掃碼 閱讀全文