在AI領域,或許我們馬上就能達成一項令人印象深刻且難以置信的里程碑成就——使得我們在語音識別方向上的取得豐碩成果現(xiàn)在就如同小孩子的游戲:人工智能(AI)系統(tǒng)可以直接將我們的大腦活動轉化為完整的文本信息。
這不是科幻小說的劇情。從動物模型到人類參與者,腦機接口在過去的幾十年中得到了長足進展,實際上已經(jīng)能看到勝利的曙光。
加州大學舊金山分校張氏實驗室的神經(jīng)外科醫(yī)生愛德華·張領導的團隊使用一種新方法來解碼腦皮層的電活動:由植入大腦的電極采集皮層活動期間發(fā)生的電脈沖。
有4名癲癇患者在腦部安裝了用于監(jiān)測癲癇癥狀的植入物,UCSF團隊借此機會進行了一項輔助實驗:讓參與者大聲朗讀并重復句子,用電極記錄他們的大腦活動。
然后,將這些數(shù)據(jù)輸入到神經(jīng)網(wǎng)絡中,該網(wǎng)絡會根據(jù)實驗的音頻記錄來分析與某些語音簽名(例如元音,輔音或嘴巴動作)相對應的大腦活動模式。
此后,另一個神經(jīng)網(wǎng)絡解碼了語義的表達形式(從重復的30–50個口頭句子收集而來),并僅基于單詞的皮層簽名來預測所說的內容。
在最佳狀態(tài)下,該系統(tǒng)可以提供足夠低的誤碼率(WER),其中只有3%腦信號被錯誤轉譯。
錯誤的例子包括:“博物館每天晚上都會聘請音樂家”,預測為“博物館每個昂貴的早上都會聘請音樂家”; “蛋糕的一部分被狗吃掉了”被預測為“蛋糕的一部分是餅干”;和“蒂娜·特納是流行歌手”變成了“#¥·特納是流行歌手”。
在最不準確的情況下,錯誤翻譯在語義上或語音上都與原文毫無關系:“她穿著溫暖的羊毛工作服”被解釋為“綠洲是海市蜃樓”。
盡管如此,盡管存在著明顯的錯誤,總體而言,該系統(tǒng)仍可構成基于AI的腦活動解碼的新基準,并且其最佳狀態(tài)與專業(yè)的人類語音轉錄系統(tǒng)相當。
當然,與通常的人類語音語言打交道的專業(yè)語言轉文字軟件必須能夠處理成千上萬個單詞。相比之下,AI腦接口系統(tǒng)目前只有有限的大約250個特定單詞的皮質簽名。
盡管還有許多障礙,但研究團隊認為,該系統(tǒng)有一天可以幫助喪失語言能力的人說話或者讓失去肢體的人單純利用意念操作假肢。如果有可能做到這一點,那將是一件了不起的成就——遠遠超出了理論科學的范疇。
作者解釋說:“在長期攜帶植入物的參與者中,可用的訓練數(shù)據(jù)量將比本研究中使用的語音語素大幾個數(shù)量級,AI的詞匯量和靈活性可被極大地擴展?!?/p>
論文發(fā)表在《自然·神經(jīng)科學》上。
本文譯自 sciencealert,由譯者 majer 基于創(chuàng)作共用協(xié)議(BY-NC)發(fā)布。
(免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產(chǎn)權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )