會搭積木的AI,正在手眼并用地探索現(xiàn)實世界

原標題:會搭積木的AI,正在手眼并用地探索現(xiàn)實世界

春節(jié)假休完,北上廣又開始上演小城媽寶慘變五環(huán)內(nèi)社畜的慘劇?;謴偷阶约合匆伦鲲埵帐拔葑拥娜兆樱贻p人們又深刻地感受到——科技不能改變生活,老媽才能。

人工智能雖然在各種游戲比賽中血虐人類,但在現(xiàn)實世界里卻不能幫助人類“血虐”家務活。在研究更適用于復雜現(xiàn)實場景的機器人這件事上,我們一直在努力。

一般來說通過計算機視覺對外界進行感知,再結(jié)合數(shù)據(jù)模擬計算規(guī)劃行動,是機器人訓練研究的一個常見的方向。

比較典型的有伯克利一直在嘗試的少樣本強化學習,類似于拿一段疊被子的視頻作為訓練數(shù)據(jù),利用獎勵機制引導AI進行學習,直到AI也學會疊被子為止。甚至還會引入“疊錯被子”的視頻作為訓練數(shù)據(jù),教導AI如何在任務執(zhí)行錯誤的過程中進行自我修正。

因為在現(xiàn)實世界,尤其是家庭、門店、餐廳這種極具生活化的場景中,存在有太多不確定性,很難像自動化技術那樣,規(guī)定好一套固定的流程。近年來研究較為深入的計算機視覺,也包括雷達傳感、紅外傳感這樣的傳感技術便被利用起來了。

除去實驗室的研究以外,我們在日常生活中也能看到很多依賴視覺能力來判定現(xiàn)實問題的機器人,例如工廠里通過視覺識別瑕疵品并進行分揀的機械手臂。但僅僅依賴視覺,或者激光雷達、紅外傳感等空間感知能力,也并不能幫助機器人們做好面對現(xiàn)實世界的準備。

就像在電影里常常出現(xiàn)這樣的情節(jié):機器人已經(jīng)發(fā)展到高度智能化,甚至和人類無異,但在做一些類似于拿起一包牛奶,或者跟人類握手的動作時,往往會掌握不好力道。

這種情節(jié)并不是完全虛構(gòu)的,對于應用視覺傳感技術的機器人來說,它們能夠辨識外界事物的形狀,卻很難判斷外界事物的質(zhì)地、密度和受力情況。所以在很多情況中,光有視覺技術是遠不足夠的。

守序善良且秀:一位非人類的職業(yè)積木玩家

比如很多人都玩過,或者在美劇里見過的桌游“疊疊樂”——用積木條堆疊成積木塔,參與玩家在不導致塔倒塌的前提下從塔身中抽出積木條,將積木條搭到塔頂端,塔在哪位玩家的回合中倒塌,哪位玩家就輸?shù)舯荣悺?/p>

“疊疊樂”就是典型的AI一定打不過人的游戲。因為這種游戲考驗的不僅是策略性,還有動手能力,取出和放置積木時動作輕了重了,都可能導致游戲失敗。不光如此,疊疊樂的游戲過程還具有很大的不確定性,堆起積木塔時每條積木位置的輕微變化,對手玩家在拿走積木條時對其他積木位置帶來的改變,都在影響著整個積木塔的穩(wěn)定性,也直接決定了玩家的下一步動作。

這種過程如果是用視覺技術理解,則需要難以想象的海量計算——堆起積木塔時每一條積木的位置、兩位玩家的每一步動作,都會造成無數(shù)的分叉結(jié)果,幾乎是不可能完成的任務。

但只需要一點點小小的不同,這個難題就被解決了。

在最近的Science Robotics期刊中,來自MIT的科研人員公布了他們最新的研究成果——用機器手臂玩疊疊樂。

項目負責人Rodriguez提到,之所以選擇疊疊樂作為實驗對象,是因為這個游戲中體現(xiàn)了機器人應用的一個重要問題——物理交互,也就是前面提到的動手能力。

為了解決物理交互問題,MIT為普通機械手臂添加了三樣東西,柔性夾鉗、有力量傳感作用的腕帶和拍攝全局畫面的攝像頭。

在進行訓練時,機械手臂每抽取一塊積木時,力量傳感器就會記錄下動作的速度和力度,不斷和上一次的數(shù)據(jù)進行對比,攝像頭也會從視覺角度進行記錄,與力量數(shù)據(jù)進行對應在分層貝葉斯模型中進行計算。在進行過大概三百次游戲后,通過兩種數(shù)據(jù)維度的配合學習,AI可以快速建立出一個聚類模型,從一個積木塔中尋找穩(wěn)定性更強的、不會破壞平衡的積木條。相比試圖找到一個能應付所有情況的模型,這種在每次移動積木時都重新聚類的方法顯然要高效很多。

在測試時,機械手臂的表現(xiàn)也很優(yōu)異,參與測試的人類志愿者紛紛表示被秀一臉,機械手臂自己玩疊疊樂時的水平已經(jīng)接近人類了。不過在與人類對戰(zhàn)時還是要落后一籌,因為人類玩家在抽取積木時會特意難為對手,在自己的回合破壞平衡性,讓積木塔很容易在下一回合倒塌。但AI還做不到這一點,在這一模型中,AI的每一步操作都是為了增強整個積木塔的穩(wěn)定性——一位典型的秩序善良玩家。

這也導致了在疊疊樂上,AI還很難實現(xiàn)和人類對戰(zhàn)。不過項目負責人Rodriguez認為,他們創(chuàng)造這個項目本來也不是為了和人類在疊疊樂游戲上一決高下的。

當AI開始多才多藝

BBC、CBS News和Wired等主流媒體都對這一研究結(jié)果給出了很高的評價,原因就在于這一研究在AI的觸覺刺激上突破,具有很高的現(xiàn)實意義。

MIT提到,目前應用在疊疊樂AI模型上的原理,同樣也可以被應用在另外一些應用機械手臂的場景中。

例如在一些數(shù)碼產(chǎn)品精細部分的組裝上,在擰一些很小的螺絲時,很難實現(xiàn)以視覺方式進行測量,只能通過觸覺進行感應。但有了“疊疊樂AI”的經(jīng)驗,普通機械手臂也能通過一些簡單的改裝,增加力量傳感機制在短時間完成訓練,學會以觸覺刺激為參考標志的組裝、包裝等工作。

雖然現(xiàn)在自動化工業(yè)生產(chǎn)線也能實現(xiàn)在無人狀態(tài)下進行精細組裝工作,但其實現(xiàn)成本是非常巨大的??赡芤粭l生產(chǎn)線只能完成某一部件上的一小顆螺絲,對于中小型廠商來說很難承擔得起。但擁有了觸覺刺激的機械手臂結(jié)合AI算法,卻可以幫助類似的功能走進小型生產(chǎn)線甚至家庭。

其實這種結(jié)合兩種緯度數(shù)據(jù)進行AI訓練的方式并非MIT獨有,在去年我們在一些類似于視頻分析的領域中,也能看到諸如畫面分析+語音分析的多模態(tài)理解。

聚焦到機器人領域中,這幾年也有很多類似的研究。例如模擬人類手指力量感知能力的機械鋼琴手,通過操作時獲取鋼琴按鍵反彈時的數(shù)據(jù)反饋,來更精準地模擬出人類彈鋼琴時的輕與重。還有低成本的生物感應電子皮膚,可以貼合在機械設備上幫助尋找施力方向。

隨著觸覺機制越來越多地被引入機器人領域,與視覺系統(tǒng)、紅外/激光雷達等其他傳感模式的結(jié)合也越來越多。

可見在探索現(xiàn)實世界的旅途中,AI正在愈發(fā)多才多藝起來。相信當機器人也開始手眼并用時,我們距離“科技改變生活”的未來也越來越近了。

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2019-02-15
會搭積木的AI,正在手眼并用地探索現(xiàn)實世界
就像在電影里常常出現(xiàn)這樣的情節(jié):機器人已經(jīng)發(fā)展到高度智能化,甚至和人類無異,但在做一些類似于拿起一包牛奶,或者跟人類握手的動作時,往往會掌握不好力道。

長按掃碼 閱讀全文