原標題:人工智能的情緒識別離我們還有多遠?
據(jù)最新的一項調(diào)查,世界人民三觀并不一定相同,但在識別“假笑”這件事兒上卻基本上都能做到。不管身處哪個國家,人們基本上都能更好地分辨出笑聲到底是真的還是假的。
這是因為自然笑容的肌肉、聲音和硬擠出來的笑容肌肉、聲音是截然不同的,比如緊繃度和流暢度。打個比方,你很容易看出來“假笑男孩”是在“假笑”。
那么,既然人能識別“假笑”,那機器能不能做到?或者說,以目前的技術(shù)發(fā)展水平來說,人工智能是否可以通過識別技術(shù)來對人進行情緒識別進而做出相應(yīng)的反應(yīng)呢?
我們知道,目前人工智能最成熟的應(yīng)用之一就是圖像和語音識別,其已經(jīng)廣泛應(yīng)用到拍照識物、畫面增強、人機交互等各種領(lǐng)域。但顯而易見的是,目前其很大程度上還是處于識別和歸類的層面,想要透過表層的識別去進行深層的情緒認識和理解,進而優(yōu)化人機交互的體驗,尚需時日。
但這并不代人們對人工智情緒識別的望塵莫及。作為對人的表層識別的深層次延伸,情緒識別帶來的變化將是非常積極的。那么,如今的人工智能情緒識別到底發(fā)展怎樣?它離進入我們的現(xiàn)實生活,到底還有多遠?
情緒大都一樣,手法各有不同
我們知道,人的情緒體現(xiàn)是多方面的。表情、語言、動作等,都可以作為人類表達情緒的載體。不同的情緒會以不同的形式體現(xiàn)出來,比如一個人開心的話就會笑,嘴巴兩邊向上翹起,眼角也會微翹;如果特別開心的話,會“哈哈”大笑。那么,很多研究者就抓住各種情緒對應(yīng)的表情或動作,來對機器進行訓練和學習。
可以說,凡是能反映情緒的地方,都已經(jīng)被研究者們翻遍了。
眼球轉(zhuǎn)動分析個性。民科對眼球轉(zhuǎn)動體現(xiàn)人的心理活動早就有過一些總結(jié),比如興奮的時候兩眼放光,沮喪的時候兩眼無光,悲傷的時候瞳孔無神,憤怒的時候怒目圓睜等等。還有人認為眼球向左上方看是說謊,右上方看則是思考。無論科學與否,其總歸是證明眼球?qū)ε袛嗳说男愿瘛⑶榫w是由一定的作用的。
比如最近由德國斯圖加特大學、澳大利亞弗林德斯大學和南澳大利亞大學的研究人員組成的團隊就開發(fā)出了一種機器學習算法,其通過對系統(tǒng)進行大量的訓練,調(diào)查了42位受試者日常生活中的眼球轉(zhuǎn)動情況,然后去評估性格特征。比如該算法可以顯示關(guān)于個人的交際能力、好奇心等,并且能與識別出大五人格中的四種。那么,能從總體上來判斷一個人的性格,某種程度上就縮小了需要識別的情緒的范圍。
微表情分析。很多情況下,人的情緒并不是大起大落的,所以情緒更多的是從微表情上體現(xiàn)出來,比如動動嘴角、眨眨眼睛。比如翻眼珠的動作可能會表示不屑一顧。因此,作為與情緒直接相關(guān)的一部分,關(guān)于微表情的研究成為眾多公司競相上馬的項目。
最近麻省理工就通過機器學習來捕捉面部表情的細微變化,從而衡量一個人的心理感受。通過把18段視頻分解為一幀一幀的圖片,模型可以通過學習來獲得相應(yīng)表情背后的情緒。最主要的是,它有別于傳統(tǒng)表情識別的一刀切,可以根據(jù)需要進行重新訓練,具有高度的個體適用性。
語言表現(xiàn)分析。除了觀色之外,判斷人的情緒的另一個直觀方法就是“察言”。比如說話聲音的高低、打字速度的快慢等等。
日本軟銀公司的情感機器人pepper,其搭載的攝像頭讓其具備表情識別的功能,同時又可以基于云端的語音識別來實現(xiàn)對人說話的語調(diào)識別,從而獲取人的說話情緒,來實現(xiàn)其所標榜的“情感機器人”的功能。同時,IBM開發(fā)的能感知情感的在線客服系統(tǒng),也可以通過學習識別藏在語法、打字速度中的人的情緒,類似的對話式情感識別人工智能還有微軟的小冰等。
除此之外,結(jié)合可穿戴設(shè)備來獲取人的脈搏頻率等體征也將有助于情感的獲得??傊?,在人臉識別、語音識別、傳感器和各種數(shù)據(jù)算法的加持下,人工智能識別情緒看起來呈現(xiàn)出欣欣向榮的態(tài)勢。
研究者的“小山頭”,或是情緒識別“笨笨的”之因
然而,我們從以上的研究現(xiàn)狀當中可以看到比較明顯的研究特點。
第一,技術(shù)研究呈現(xiàn)“小山頭”。即很多研究者都在試圖通過自己所擅長的技術(shù)領(lǐng)域去進行解釋和實驗,比如有的擅長圖像識別,有的擅長語音識別,有的則擅長傳感器數(shù)據(jù)分析等。這些研究者或研究團隊往往擁有自己的技術(shù)優(yōu)勢,但也存在一定的短板。
第二,技術(shù)研究的實驗室限制。雖然三歲小孩兒都會“看人臉色”,但這對機器來說已經(jīng)殊為不易。因此,目前的情緒識別仍然處于起步階段,很多技術(shù)還存在于實驗室或論文當中。而這離走進現(xiàn)實,至少要三五個年頭。
即便是一些公司研發(fā)出成品應(yīng)用,其也一直飽受詬病,顯得笨笨的。比如pepper常被吐槽總是聽不清人說的話,小冰受到的吐槽更是一言難盡。技術(shù)尚未成熟就推出產(chǎn)品,其用戶粘性自然不值一提。
那么,為什么情緒識別對pepper、小冰們來說這么難呢?
正常來說,利用機器識別人的表情從而進行情緒判斷是非常有想象力的,而且遠景誘人。因為即便是人,有時候也很難察覺一些一閃而過的表情,導致無法判斷對方此時的心理情緒。但是擁有了成熟圖像識別和聲音捕捉能力的人工智能,處理這些事情看來應(yīng)該是如砍瓜切菜。
那么,導致人工智能“笨笨的”的現(xiàn)狀,也算是事出有因了。
比如我們上文分析過的一個原因。各研究團隊或公司往往是利用一種或兩種識別技術(shù)進行情緒判斷,或抓住某個微表情、某一個聲音,這顯然是不完善的、片面的。比如“憤怒”和“激勵”兩種情緒,瘋狂的激勵往往表現(xiàn)為離奇的憤怒,同樣都是怒目圓睜、吼聲震天,人工智能該如何把這兩種情緒識別開?
這時候,單純的表情識別和聲音識別就體現(xiàn)出局限性了,其還有必要加入動作識別。比如手是握緊拳頭的加油狀,還是食指指向?qū)Ψ降奶翎厾?。如果再加上語言內(nèi)容識別等其他因素,形成一個綜合性因素的判斷,將更有利于情緒的精準識別。
也就是說,情緒識別也就不僅僅是“察言觀色”的事兒,還必須要“觀其行”,對人進行全方位、立體式分析。
此外,情緒識別還有可能因為虛假的表象而增加難度。比如文章開頭提到的假笑。單單是識別人們的最直觀情緒就已經(jīng)困難重重,如何去破解隱藏在偽裝背后的情緒就顯得更為棘手。
(非常低落而緩慢地跟小冰說話得到無情回答)
但情緒識別的難度顯然并非僅僅是我們以上分析的幾點。原因在于,情緒是一種心理行為,其也會由于個體的不同而展現(xiàn)出不同的表現(xiàn)形式,比如不同的文化當中同一手勢就代表不同的意思,就像貼面在有的國家是禮節(jié)行為,在有的國家就是流氓行徑。
因此,情緒與心理相關(guān)的復雜性導致其與人的動作、表情并不一定呈必然相關(guān)性。但這并不意味著就沒有研究它的意義,反而讓我們能夠明確:研究情緒識別并不是一定要令每種情緒都有對應(yīng)的外在表現(xiàn),而是能夠最大程度地利用人工智能幫助我們理解情緒,從而挖掘更多的可能。
不僅能聊天,還能破個案?
那么,人工智能情緒識別能力的提升,究竟可以給我們提供哪些方面的便利之處?
首先,人機交互的體現(xiàn)更加自然順暢,也將直接扭轉(zhuǎn)人們?nèi)粘Α叭斯ぶ悄堋钡摹叭斯ぶ钦稀痹u價。這對于空巢老人、兒童的陪護將起到積極的作用。通過對人的情緒捕捉,它可以為老人兒童提供心理安慰。而在這個基礎(chǔ)上,利用人工智能進行情緒識別也能更好地幫助解決心理疾病問題,分擔心理醫(yī)生的精力。尤其是在對話這塊兒,成熟的人工智能會在對話的過程中照顧到患者的情緒,從而慢慢地緩解病情。
并且,在對老人的看護之中,其還可以根據(jù)微表情的識別來判斷老人是否有老年癡呆的情況,從而能夠及時作出提醒。比如上文提到的麻省理工開發(fā)的情緒識別算法,既識別了情緒,必然對微表情能夠進行熟練而準確的分析。
其次,情緒識別能夠幫助提高犯罪審訊的效率。影視劇中經(jīng)常出現(xiàn)的一幕是,嫌犯坐在審訊室若無其事,任憑警察如何審訊,其始終一言不發(fā)。而我們知道,警方在利用掌握的已知證據(jù)“詐”嫌犯的時候,也是非常想知道嫌犯的心理底線到底還有多遠。
那么,在審訊室裝個攝像頭、傳感器,另一邊的技術(shù)室實時進行對嫌犯的脈搏、體溫、表情、喉結(jié)蠕動等各個細節(jié)的分析檢測,更有助于掌握嫌犯的心理變化情況,從而對審訊進程了如指掌。比如宜興市檢察院就和中國政法大學聯(lián)合建立了微反應(yīng)實驗室,并且通過對犯罪嫌疑人轉(zhuǎn)瞬即逝的表情的成功捕捉,調(diào)整了審訊的方向,成功引導嫌犯交代事實。
可以預(yù)見的是,隨著情緒識別的成熟,這項技術(shù)將很快會部署到警務(wù)系統(tǒng)當中。
最后,微表情將對涉及安全作業(yè)的情況對人進行實時提醒?,F(xiàn)代社會工作呈現(xiàn)出高強度的態(tài)勢,人們?yōu)榱松鎺缀醵荚谄S诒济?,比如司機。
疲勞駕駛是造成車禍的主要原因之一,尤其在高速上。往往是一秒鐘的打盹,造成了一輩子的悲劇。如果車輛在出廠的時候就配置了以情緒識別為主要構(gòu)成的疲勞駕駛提醒系統(tǒng),在司機打哈欠、瞇縫眼、乃至“磕頭”的時候不斷進行警報提醒,并提出休息建議,將可以在一定程度上降低車禍發(fā)生概率。
此外,利用情緒識別來管理和控制情緒也可能會成為一些情緒易失控者的福音。
總之,盡管情緒識別目前還很單薄,不足以令其成為粘度很高的日常產(chǎn)品。但可以肯定的是,一旦技術(shù)成熟,其帶來的益處將不僅僅是工業(yè)級的,更是貼近最廣大的消費者。當情緒可以被當作讀懂自己的鏡子,人們也就可以獲得更多來自他“人”的理解,從而解決更多實際生活中的難題。
可是,你有沒有想過可能由此而來的另外一個難題:鑒于深度學習的黑箱問題尚未解決,萬一人工智能具備了自主的人類情感怎么辦?
那還能怎么辦?準備拿起武器戰(zhàn)斗吧……
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計劃瞄準AI機器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費引熱議
- 消息稱塔塔集團將收購和碩印度iPhone代工廠60%股份 并接管日常運營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機器人合作
- 賽力斯觸及漲停,汽車整車股盤初強勢拉升
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。