文 / VRAR星球 維克多
虛擬現(xiàn)實(shí)和人工智能領(lǐng)域的先驅(qū)人物路易斯·羅森博格(Louis Rosenberg),近日在知名科技網(wǎng)站VentureBeat發(fā)聲,指出由AI(人工智能)/AR(增強(qiáng)現(xiàn)實(shí))賦能、能增強(qiáng)智力的語境感知AI助手(AI assistants with context awareness),將由Meta引領(lǐng)推動(dòng)、多家企業(yè)同步研發(fā),在 2024 年進(jìn)入社會(huì),并會(huì)在短短幾年內(nèi)顯著改變我們的世界。我們即將生活在一個(gè)公司可以將影響我們行為和看法的聲音放進(jìn)我們大腦的世界,拒絕的后果是在競(jìng)爭(zhēng)中處于劣勢(shì)……伴隨這項(xiàng)技術(shù)的負(fù)面問題如果得不到解決,會(huì)將社會(huì)推向危險(xiǎn)境地。
路易斯·羅森博格
羅森博格在VR、AR、AI和人機(jī)交互等方面獲得過300多項(xiàng)專利。早在上世紀(jì)90年代初,他就為美國空軍開發(fā)創(chuàng)建了第一個(gè)交互式AR系統(tǒng)。創(chuàng)立了早期的VR公司Immersion Corporation(1993年)和早期的AR公司Outland Research(2004年)、以及3D數(shù)字化公司Microscribe,目前是位于美國斯坦福大學(xué)從事人工智能研發(fā)的Unanimous AI公司CEO。
筆者在2022年介紹過他對(duì)虛擬現(xiàn)實(shí)的看法:上世紀(jì)九十年代初,是互聯(lián)網(wǎng)謀殺了紅極一時(shí)的VR,而今天“由輕型眼鏡支持的增強(qiáng)現(xiàn)實(shí)將創(chuàng)造一個(gè)AR元宇宙。它將改變我們的生活,取代手機(jī)和臺(tái)式機(jī),成為我們數(shù)字內(nèi)容的主要界面?!保ā禫R元老確信虛擬現(xiàn)實(shí)技術(shù)十年內(nèi)將獲廣泛應(yīng)用》)
耳中的私語
羅森博格指出,在不久的將來,人工智能助手將會(huì)在你耳中安家,竊竊私語,時(shí)時(shí)為你的日常生活提供幫助。它將積極參與你生活的方方面面,當(dāng)你在擁擠的商店中瀏覽貨架上的商品時(shí),或是帶孩子去看兒科醫(yī)生時(shí),即使是在自家私密空間從櫥柜里拿塊點(diǎn)心時(shí)——人工智能助手都會(huì)提供有益的信息。它將調(diào)解你的所有經(jīng)歷,包括你跟朋友、親戚、同事及陌生人的社交。
當(dāng)然,“調(diào)解”這個(gè)詞是個(gè)委婉的說法,即表示允許人工智能影響你的言行、思考和感受。許多人會(huì)覺得這個(gè)概念令人毛骨悚然。然而,作為一個(gè)社會(huì),我們會(huì)接受這項(xiàng)技術(shù)進(jìn)入我們的生活,允許自己不斷地受到友善聲音的指導(dǎo),這些聲音以高超的技巧告知并指導(dǎo)我們。不久人們就會(huì)知道,我們的生活將會(huì)很難離開這些實(shí)時(shí)幫助。
語境感知AI助手
當(dāng)使用“AI助手”這個(gè)短語時(shí),大多數(shù)人會(huì)想到像 Siri 或 Alexa 這樣的老式工具——它們?cè)试S用口頭指令發(fā)出簡(jiǎn)單要求。但這不是正確的思維模式。因?yàn)橄乱淮斯ぶ悄苤謱ㄒ环N改變一切的新成分——語境感知。
當(dāng)你說“hey Siri”時(shí)
這種附加性能使系統(tǒng)不僅能夠?qū)δ阏f的話做出反應(yīng),還能對(duì)你當(dāng)前所經(jīng)歷的周圍景象和聲音做出反應(yīng),這些景象和聲音由你佩戴在身上的人工智能設(shè)備的攝像頭和麥克風(fēng)捕獲。
不管你是否期待,語境感知AI助手都將在 2024 年進(jìn)入社會(huì),它們會(huì)在短短幾年內(nèi)顯著改變我們的世界。它們會(huì)釋放出強(qiáng)大的能量,并伴隨著對(duì)個(gè)人隱私和人事代理的大量新風(fēng)險(xiǎn)。
從積極方面來看,無論你走到哪里,這些人工智能助手都會(huì)提供有價(jià)值的信息,跟你正在做的、說的或看的任何內(nèi)容精確協(xié)調(diào)。指導(dǎo)被如此順暢而自然地傳遞,感覺就像是一種超能力。一個(gè)聲音無所不知,在你腦海中盤踞:從商店櫥窗里的產(chǎn)品規(guī)格,到你在徒步旅行中遇到的植物名稱,再到你能用冰箱里散落的食材制作出美味佳肴。
從消極方面來看,這種無處不在的聲音可能具有很強(qiáng)的甚至是操縱性的說服力。因?yàn)樗梢詭椭阃瓿扇粘;顒?dòng),特別是如果公司使用這些值得信賴的AI助手來部署有針對(duì)性的對(duì)話廣告。
多模態(tài)大型語言模型飛速興起
人工智能操縱的風(fēng)險(xiǎn)是可以減輕的,但需要決策者專注于這個(gè)關(guān)鍵問題。然而,到目前為止,這一問題基本被忽略了。當(dāng)然,監(jiān)管機(jī)構(gòu)沒有太多時(shí)間,這種使語境感知AI助手能夠用于主流用途的技術(shù),至今問世還不到一年。
語境感知AI助手是一種多模態(tài)大型語言模型——一種新的LLM(Large Language Model)。它不僅可以接受文本提示,還可以接受圖像、音頻和視頻的輸入。這是一個(gè)巨大進(jìn)步:多模態(tài)模型一下子賦予AI系統(tǒng)自己的眼睛和耳朵,該系統(tǒng)將利用這些感覺器官來評(píng)估我們周圍的世界,實(shí)時(shí)提供指導(dǎo)。
第一個(gè)主流多模態(tài)模型是 ChatGPT-4,由 OpenAI 在2023 年 3 月發(fā)布。最近進(jìn)入這一領(lǐng)域的大廠是谷歌,幾周前它宣布了Gemini LLM。
羅森博格認(rèn)為最有趣的模型來自Meta。這個(gè)名為 AnyMAL 的多模態(tài) LLM,還帶有運(yùn)動(dòng)提示。該模型超越了眼睛和耳朵,增加了前庭的運(yùn)動(dòng)感。這可以用來創(chuàng)建一個(gè)人工智能助手,它不僅能看到和聽到你所經(jīng)歷的一切,還會(huì)考慮你身體的運(yùn)動(dòng)狀態(tài)。
一直跟蹤的大問題
隨著這種人工智能技術(shù)現(xiàn)在可供消費(fèi)者使用,公司正急于將它們構(gòu)建到可以指導(dǎo)您完成日?;?dòng)的系統(tǒng)中。這意味著將攝像機(jī)、麥克風(fēng)和移動(dòng)運(yùn)動(dòng)傳感器放在你的身上,以便為 AI 模型提供信息,并允許它在你生活的方方面面提供語境感知幫助。
放置這些傳感器最自然的地方是眼鏡,因?yàn)檫@樣可以確保攝像頭朝向人注視的方向。眼鏡(或耳機(jī))上的立體聲麥克風(fēng)還能以空間保真捕捉聲景,使人工智能能夠知道聲音的來源——比如是吠叫的狗、鳴笛的汽車還是哭泣的孩子。
在羅森博格看來,目前引領(lǐng)該領(lǐng)域產(chǎn)品發(fā)展的公司是 Meta。兩個(gè)月前,他們開始銷售新版Ray-Ban智能眼鏡,該眼鏡配置了高級(jí)AI模型。他說自己一直在跟蹤的一個(gè)大問題——就是Meta何時(shí)會(huì)推出提供語境感知AI助手所需的軟件。
Ray-Ban智能眼鏡
現(xiàn)在這不再是一個(gè)未知數(shù)。去年12 月 12 日,他們開始提供對(duì)AI的早期訪問,其中包括一些非凡的功能。在發(fā)布的視頻中,馬克·扎克伯格要求AI助手為他正在看的襯衫搭配一條褲子,AI助手非常熟練地給出了答案。其他類似的指導(dǎo)AI助手也能提供,像在烹飪、購物、旅行以及社交活動(dòng)時(shí)。而且,援助將是語境感知的。比如,當(dāng)你路過寵物店,AI助手會(huì)提醒你購買狗糧。
另一家進(jìn)入這一領(lǐng)域的知名公司是 Humane,它開發(fā)了一種帶有攝像頭和麥克風(fēng)的可穿戴徽章。他們的設(shè)備將于 2024 年初開始發(fā)貨,可能會(huì)激起鐵桿技術(shù)粉的想象力。
Humane公司的AI Pin
羅森博格認(rèn)為,眼鏡上的傳感器比戴在身上的傳感器更有效,因?yàn)樗鼈兛梢园l(fā)現(xiàn)用戶看著的方向,并且能為視線添加視覺元素。這些元素在今天還只是簡(jiǎn)單的疊加,但在未來五年內(nèi),它們將會(huì)成為豐富而沉浸式的混合現(xiàn)實(shí)體驗(yàn)。
不管這些語境感知AI助手是否由帶傳感器的眼鏡、耳機(jī)或徽章實(shí)現(xiàn),它們都將在未來幾年內(nèi)被廣泛采用。因?yàn)樗鼈冃阅軓?qiáng)大,可以提供從外語實(shí)時(shí)翻譯到歷史知識(shí)等各種幫助。
而最重要的是,這些設(shè)備將在社交互動(dòng)中提供實(shí)時(shí)幫助,提醒我們?cè)诮稚嫌龅降耐碌拿?,在談話停頓時(shí)建議我們說些有趣的事情。甚至可以根據(jù)交談?wù)叩奈⒚蠲娌勘砬榛蚵曇艟€索,在他感到惱火或無聊時(shí)及時(shí)警告我們。
竊竊私語的人工智能助手會(huì)讓每個(gè)人看起來更迷人、更聰明、更具社會(huì)意識(shí),并可能更有說服力,因?yàn)樗鼈儗?shí)時(shí)指導(dǎo)我們。而且,這將成為一場(chǎng)“軍備競(jìng)賽”,助手們努力給我們提供優(yōu)勢(shì),以保護(hù)我們免受他人影響。
增強(qiáng)智力與數(shù)字鴻溝
作為研究人工智能和混合現(xiàn)實(shí)影響的終身研究者,幾十年來羅森博格一直擔(dān)心對(duì)話影響的風(fēng)險(xiǎn)。為了提高人們的認(rèn)識(shí),幾年前,他發(fā)表了一篇名為《碳約會(huì)》的短篇小說,寫一個(gè)虛構(gòu)的人工智能,在人的耳邊不斷低聲說著建議。
在故事中,一對(duì)老年人第一次約會(huì),兩人完全按人工智能指導(dǎo)說話。這也許是兩個(gè)數(shù)字助理的求愛儀式,而不是兩個(gè)人,但這種具有諷刺意味的場(chǎng)景可能很快就會(huì)變得司空見慣。
當(dāng)然,最大的風(fēng)險(xiǎn)不是當(dāng)我們與朋友、家人和戀人聊天時(shí),人工智能助手會(huì)插嘴。最大的風(fēng)險(xiǎn)是企業(yè)或政府實(shí)體如何注入自己的議程,實(shí)現(xiàn)強(qiáng)大的對(duì)話影響形式,以人工智能生成的定制內(nèi)容為目標(biāo),最大限度地發(fā)揮其對(duì)每個(gè)人的影響。為了讓公眾了解這些被操縱的風(fēng)險(xiǎn),負(fù)責(zé)任的元宇宙聯(lián)盟最近發(fā)布了《隱私丟失》(Privacy Lost ,2023) ,這是一部關(guān)于人工智能操縱風(fēng)險(xiǎn)的短片。
對(duì)于很多人來說,允許人工智能助手在他們耳邊竊竊私語,是他們打算避免的令人毛骨悚然的情況。問題是,一旦絕大多數(shù)用戶接受了強(qiáng)大的人工智能工具指導(dǎo),我們這些拒絕這一工具的人將處于劣勢(shì)。
事實(shí)上,人工智能指導(dǎo)可能會(huì)成為生活中基本社交規(guī)范的一部分。你遇到的每個(gè)人都希望你在進(jìn)行對(duì)話時(shí),實(shí)時(shí)獲得有關(guān)他們的信息。問別人以什么謀生或在哪里長大,可能會(huì)變得很不禮貌,因?yàn)檫@些信息只會(huì)出現(xiàn)在你的眼鏡里或在你耳邊低語。
而且,當(dāng)你說出一些聰明或深刻的話語,沒有人知道你是自己想出來的,還是只是在大腦中鸚鵡學(xué)舌地模仿人工智能助手。事實(shí)是,我們正在走向一個(gè)新的社會(huì)秩序,在這個(gè)秩序中,我們不僅受到人工智能的影響,而且通過企業(yè)提供的人工智能工具有效地增強(qiáng)了我們的心理和社交能力。
羅森博格把這種技術(shù)趨勢(shì)稱為“增強(qiáng)智力”(augmented mentality)。他認(rèn)為這是不可避免的,不過還需更多時(shí)間,才能讓人工智能產(chǎn)品,完全可以用于指導(dǎo)日常思維和行為。然而,隨著語境感知LLM的最新進(jìn)展,目前不再存在很大的技術(shù)障礙。
即將到來的可能是一場(chǎng)“軍備”競(jìng)賽。在這場(chǎng)競(jìng)賽中,大型科技公司的巨頭們將爭(zhēng)奪誰能把最強(qiáng)大的人工智能指導(dǎo)輸入你的眼睛和耳朵的話語權(quán)。然而,這種企業(yè)推動(dòng)可能會(huì)在那些買得起智能增強(qiáng)工具的人和買不起的人之間造成危險(xiǎn)的數(shù)字鴻溝。更糟糕的是,那些負(fù)擔(dān)不起訂閱費(fèi)的人,可能會(huì)被迫接受由聲勢(shì)浩大的人工智能對(duì)話影響力所提供的贊助廣告。
是采取行動(dòng)的時(shí)候了
羅森博格指出,我們即將生活在一個(gè)公司真的可以將影響我們行為和看法的聲音放進(jìn)我們頭腦中的世界。這就是人工智能操縱的問題——它是如此令人擔(dān)憂。我們迫切需要對(duì)人工智能系統(tǒng)進(jìn)行積極的監(jiān)管,因?yàn)檫@些系統(tǒng)可以實(shí)時(shí)圍繞單個(gè)用戶實(shí)施“閉環(huán)”,在傳遞定制影響的同時(shí)感知我們的個(gè)人行為。
不幸的是,白宮最近的關(guān)于人工智能的行政命令并沒有涉及這個(gè)問題,而歐盟最近的人工智能法案只是一帶而過地觸及了它。然而,旨在指導(dǎo)我們一生的消費(fèi)電子產(chǎn)品馬上就要充斥整個(gè)市場(chǎng)。
最后,他警告道:“隨著我們進(jìn)入 2024 年,我真誠地希望世界各國的政策制定者聚焦人工智能驅(qū)動(dòng)的對(duì)話影響的罕見風(fēng)險(xiǎn),特別是語境感知AI助手的操縱。如果他們深思熟慮地解決這些問題,消費(fèi)者就可以從人工智能的指導(dǎo)中受益,而不會(huì)使社會(huì)滑向危險(xiǎn)的境地?,F(xiàn)在是采取行動(dòng)的時(shí)候了?!?/p>
希望羅森博格的警告能引起各國當(dāng)政者重視,并積極采取行動(dòng)。也希望語境感知AI助手在增強(qiáng)人類智力的同時(shí),能夠避免可能給人類帶來的災(zāi)禍。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 卷又不動(dòng),躺又不平!網(wǎng)易困在舒適區(qū)!
- 時(shí)代紅利的十字路口?《激流2》記錄五大行業(yè)的商業(yè)博弈
- 網(wǎng)翎衛(wèi)星上網(wǎng)機(jī)馳援緬甸地震,8 場(chǎng)高清直播連線詮釋“中國溫度”
- AI重塑云基礎(chǔ)設(shè)施,亞馬遜云科技打造AI定制版IaaS“樣板房”
- 謠言也有“殺傷力”,農(nóng)夫山泉應(yīng)對(duì)輿情錯(cuò)在什么地方?
- 企業(yè)級(jí)AI“脫虛向?qū)崱保涞剡€有幾道檻?
- 電商新趨勢(shì),從“真人一鍵克隆”數(shù)字人進(jìn)軍直播間開始
- 劉興亮 | 如何走出AI幻覺
- 在線教育退潮,硬件增長啞火!網(wǎng)易有道押注AI!
- 上線月余日單百萬,和商家聊完,該重估京東外賣了
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。