谷歌也干了?Bard被曝使用ChatGPT的數(shù)據(jù)進(jìn)行訓(xùn)練 大模型真是一步落后步步落后

極客網(wǎng)·極客觀察(舒云)3月31日 還記得百度文心一言被質(zhì)疑是"套殼"事件嗎?近日外媒爆料,谷歌似乎也這么干了。

 

據(jù)The Information報(bào)道,前谷歌人工智能研究員Jacob Devlin最近離開公司加入了OpenAI,但在此之前,他爆料曾向谷歌母公司Alphabet的CEO 桑達(dá)爾·皮查伊(Sundar Pichai)警告,谷歌的聊天機(jī)器人Bard正在以一種間接的方式從ChatGPT獲取數(shù)據(jù)。

據(jù)Devlin描述,Bard的開發(fā)團(tuán)隊(duì)訪問了一個(gè)名為ShareGPT的網(wǎng)站,該網(wǎng)站分享發(fā)布了大量用戶通過ChatGPT獲取的聊天內(nèi)容。這意味著,Bard使用了ChatGPT現(xiàn)成的數(shù)據(jù)來“武裝”自己,相當(dāng)于竊取了ChatGPT的早期成果。

對此,谷歌發(fā)言人 Chris Pappas 很快向媒體發(fā)布聲明,堅(jiān)決而明確地表示,"Bard沒有使用任何ShareGPT或ChatGPT的數(shù)據(jù)進(jìn)行訓(xùn)練。(“Bard is not trained on any data from ShareGPT or ChatGPT.”)"

對于媒體追問谷歌Bard此前是否曾經(jīng)利用過ChatGPT的數(shù)據(jù),Pappas拒絕回答,堅(jiān)稱自己能說的只是如上聲明內(nèi)容。

這一事件不由得令人想起日前百度文心一言遭遇的類似質(zhì)疑。

3月下旬,有網(wǎng)友發(fā)文質(zhì)疑百度文心一言作畫實(shí)質(zhì)上是“把中文句子機(jī)翻成英語單詞,拿去用國外剛剛開源的人工智能Stable Diffusion生成了圖畫,再返給你,說是自己畫的?!?/p>

當(dāng)時(shí)網(wǎng)友舉的例子包括在文心一言輸入指令,要求其畫出“鼠標(biāo)和總線”,文心一言作出的畫面是“老鼠和公共汽車”,因?yàn)椤笆髽?biāo)”和“總線”對于的英文是“mouse”和“bus”。

對此百度方面也是緊急回應(yīng)。3月23日,百度發(fā)布聲明稱,文心一言完全是百度自研的大語言模型,文生圖能力來自文心跨模態(tài)大模型ERNIE-ViLG。在大模型訓(xùn)練中,百度使用的是全球互聯(lián)網(wǎng)公開數(shù)據(jù),符合行業(yè)慣例。同時(shí)表示文心一言正在使用過程中不斷學(xué)習(xí)和成長,希望大家給自研技術(shù)和產(chǎn)品一點(diǎn)信心。

隨后,百度對類似問題做了修正,用戶很快發(fā)現(xiàn)相關(guān)問題已經(jīng)不存在,表明類似情況正隨著用戶反饋而被修正。

對于百度文心一言的問題,業(yè)界專家也表示使用網(wǎng)絡(luò)公開數(shù)據(jù)是行業(yè)基本操作。這個(gè)行業(yè)存在一批專門為AI應(yīng)用訓(xùn)練數(shù)據(jù)的中間服供商,它們基于公開數(shù)據(jù)標(biāo)注訓(xùn)練的AI數(shù)據(jù)集確實(shí)存在同時(shí)被多個(gè)AI應(yīng)用采用的情況。

不過業(yè)內(nèi)基本操作在消費(fèi)者層面可能不會(huì)得到同樣的理解和認(rèn)同,此番谷歌Bard被曝使用ChatGPT的數(shù)據(jù)進(jìn)行訓(xùn)練也在國外引發(fā)軒然大波,不少網(wǎng)友指責(zé)谷歌是在盜竊OpenAI的成果。

包括網(wǎng)站信息在內(nèi)的網(wǎng)絡(luò)公開數(shù)據(jù)很容易被技術(shù)手段抓取,這對搜索引擎出身的谷歌更是小菜一碟。加之這樣的爆料來自谷歌剛離職的員工,可信度自然提升了一大截。

不過也有網(wǎng)友指出,Devlin離開谷歌AI團(tuán)隊(duì)后轉(zhuǎn)而就加入了競爭對手OpenAI,其爆料難免涉及商業(yè)利益,真實(shí)度有待進(jìn)一步確認(rèn)。

不過在極客網(wǎng)看來,不管這樣的事件真實(shí)度如何,都充分表明一個(gè)“鐵律”:AI大模型領(lǐng)域真是一步落后步步落后,后來者想要趕上先發(fā)者是水平,非常不容易。

這背后的影響因素有很多,包括算法、算力,以及訓(xùn)練數(shù)據(jù)的質(zhì)量等。更重要的是,先發(fā)的AI大模型在探明成功之路后,便會(huì)一直訓(xùn)練、一直進(jìn)化,不會(huì)停下來等待追趕者。

正因?yàn)槿绱?,OpenAI的GPT已經(jīng)很快由GPT-3升級到了GPT-4時(shí)代,為此還引發(fā)了包括馬斯克在內(nèi)的多位名人聯(lián)名發(fā)布公開信,呼吁大公司暫停大模型的研發(fā)速度,避免威脅人類。

 

李彥宏此前面對媒體采訪時(shí)也表示,盡管在某些領(lǐng)域表現(xiàn)更出色,總體看百度文心一言與OpenAI ChatGPT的水平還有一兩個(gè)月的差距。他同時(shí)指出,ChatGPT早期剛推出時(shí)外界反饋比文心一言還要糟糕。

對于谷歌Bard來說,還有一個(gè)不利消息是據(jù)傳谷歌的 Brain 人工智能團(tuán)隊(duì)正在與另一家隸屬于 Alphabet 的人工智能公司 DeepMind 合作,共同進(jìn)行一個(gè)代號為 Gemini 的新項(xiàng)目,目標(biāo)是開發(fā)出一個(gè)能與 OpenAI的GPT競爭的產(chǎn)品。這似乎在暗示,谷歌對Bard并不自信,希望開發(fā)更領(lǐng)先的AI大模型,打造更先進(jìn)的AI聊天機(jī)器人。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-03-31
谷歌也干了?Bard被曝使用ChatGPT的數(shù)據(jù)進(jìn)行訓(xùn)練 大模型真是一步落后步步落后
極客網(wǎng)·極客觀察(舒云)3月31日 還記得百度文心一言被質(zhì)疑是"套殼"事件嗎?近日外媒爆料,谷歌似乎也這么干了。據(jù)The Information報(bào)道,前谷歌人工智能研究員Jacob Devlin最近離開公司加入了OpenAI,但在此之前,他爆料曾向谷歌母公司Alphabet的CEO 桑達(dá)爾·皮查伊(Sundar Pi...

長按掃碼 閱讀全文