【網(wǎng)易智能訊 8月15日消息】對于一個未經(jīng)訓練的人工智能來說,世界不過是一個模糊的數(shù)據(jù)流。大多數(shù)人類都可以無障礙地理解周圍的畫面和聲音,但只有這些畫面和聲音被明確地標記出來,算法才能掌握這一技能。
如今,人工智能公司DeepMind開發(fā)了一種新的AI技術,通過讓其觀察短小的視頻片段,AI就能學會一系列視覺和聽覺的概念并將其識別區(qū)分。例如,這種人工智能可以理解草坪修剪或撓癢癢的概念,但它還沒有掌握如何用語言來描述它感受到的畫面或聲音。
對此,加州大學伯克利分校教授皮利特·阿格拉沃爾說:“我們想要制造一種機器,它能以自主的方式不斷從自身所處的環(huán)境中學習進步。”阿格拉沃爾說,這個項目讓我們更接近創(chuàng)造真正人工智能的目標,通過自學來觀察和傾聽周圍的世界。
大多數(shù)計算機視覺算法需要輸入大量的標簽圖像,這樣它就能區(qū)分不同的物體。通過展示成千上萬張貓咪的照片,它很快就能學會識別貓,即使是之前從未見過的圖片。
但DeepMind的項目負責人ReljaArandjelovic表示,這種被稱為“監(jiān)督學習”的教學算法是不可擴展的。它的算法不再依賴于人標記的數(shù)據(jù)集,而是通過將所看到的與所聽到的內容相匹配,從而學會識別圖像和聲音。
像人一樣學習
“人類尤其擅長這種學習,”瑞士伯爾尼大學的教授保羅·法瓦羅說道。他說:“我們身邊可沒有人到處跟著我們,告訴我們一切都是什么。”
據(jù)悉,他是通過兩個網(wǎng)絡來創(chuàng)建算法的:一個專門識別圖像的網(wǎng)絡,以及一個識別音頻的網(wǎng)絡。他展示了從短片中截取的圖像識別網(wǎng)絡,而音頻識別網(wǎng)絡則從每段視頻中截取的1秒的音頻片段中進行了訓練。
第三個網(wǎng)絡將靜態(tài)圖像與音頻片段進行對比,以了解視頻中哪些聲音與哪些視頻中的圖像相符合??傊@個系統(tǒng)是經(jīng)過40萬個視頻中截取的6000萬個靜態(tài)音頻訓練的。
該算法學會了在沒有單一概念的特定標簽的情況下,如何識別音頻和視覺概念,包括人群、踢踏舞和水。舉個例子,當你看到某人拍的照片時,大多數(shù)時候它知道哪個聲音與哪個圖像有關。
視覺與聽覺
“這種合作學習方法還可以延伸到除了視覺和聽覺之外的感官,”他說。“比如,同時學習視覺和觸覺功能,可以讓人工智能在黑暗中搜索物體,并學習諸如摩擦力等物體屬性。”
消息稱,DeepMind將在10月下旬在意大利威尼斯召開的計算機視覺國際會議上展示這項研究。
雖然DeepMind項目中的人工智能與現(xiàn)實世界沒有互動,但研究人員表示,完善自我監(jiān)督學習最終會讓我們創(chuàng)造出能夠在現(xiàn)實世界中運行的人工智能,并從它所看到和聽到的東西中學習。
但在我們達到這一目標之前,自我監(jiān)督式學習可能是一種很好的方式,這樣可以訓練圖像和音頻識別算法,而無需輸入大量人類標記的數(shù)據(jù)。DeepMind的算法可以將80%的音頻剪輯按照時間的順序正確地歸類,這使得它在音頻識別方面比許多在標簽數(shù)據(jù)上訓練的算法更出色。這些可喜可賀的成果表明,類似的算法或許能夠通過分析YouTube上數(shù)百萬個在線視頻等海量未標記的數(shù)據(jù)集來學習更多的知識。“世界上的大多數(shù)數(shù)據(jù)都沒有被標記出來,因此開發(fā)從未標記的數(shù)據(jù)中學習的系統(tǒng)是有意義的,”阿格拉沃爾教授這樣說道。(選自:newscientist作者:MattReynolds 編譯:網(wǎng)易見外智能編譯平臺審校:姜啟航)
- 華為智能門鎖2亮相:解鎖新體驗,掌靜脈識別+超清貓眼,安全又便捷,僅售2499元!
- 華為智慧屏新品發(fā)布:智慧與顏值并存,國補后僅售3999.2元起
- 綠米Aqara智能溫控器W400新上市:三合一設備接入,雙協(xié)議支持,物超所值的智能家居新選擇!
- 華為新智能門鎖:掌靜脈識別解鎖,安全守護升級,4月16日預售等你來!
- 華為智能眼鏡2代:鈦空圓框與光學鏡完美融合,售價2299元,科技與時尚的完美結合?
- OPPO新款智能手表:小巧實用,行業(yè)首出發(fā)出安全守護,僅售1529元起
- 蘋果WatchOS 12升級:iPhone依賴型智能功能Apple Intelligence來襲,讓智能手表更聰明!
- 小米米家空調Pro人感上風出新玩法:毫米波雷達科技,3999元感受智能新體驗
- 小米新款智能嵌入式洗碗機開售:消存一體解決洗碗難題,國補價5119.2元起,實用又高效
- 小米全新米家控溫淋浴花灑,大置物平臺+眾籌價499元,打造舒適淋浴體驗
免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產(chǎn)權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。