英偉達(dá)教機(jī)器人向人類學(xué)習(xí),只看一遍就能成功模擬!

英偉達(dá)西雅圖研究團(tuán)隊開發(fā)了一套新系統(tǒng),可以通過觀察一個人的行為來教機(jī)器人執(zhí)行新任務(wù),機(jī)器人只需觀看一次便可成功模擬人類的簡單行為,讓機(jī)器人在充滿人類的地方工作,甚至可以向人類學(xué)習(xí)。

英偉達(dá)教機(jī)器人向人類學(xué)習(xí),只看一遍就能成功模擬!

工業(yè)機(jī)器人通常總是一遍又一遍地重復(fù)已經(jīng)編程好的的任務(wù),通常情況下,機(jī)器人與編寫程序的工程師之間存在距離。然而,越來越多的研究人員開始思考如何讓機(jī)器人在充滿人類的地方工作,甚至可以向人類學(xué)習(xí)

在某種程度上,這正是Nvidia在西雅圖的新機(jī)器人實(shí)驗(yàn)室所關(guān)注的,該公司的研究團(tuán)隊今天在澳大利亞的機(jī)器人與自動化國際會議(ICRA)上,展示了機(jī)器人如何向人類學(xué)習(xí)的試驗(yàn),以及其最近關(guān)于機(jī)器人教學(xué)的工作。

正如英偉達(dá)的機(jī)器人技術(shù)研究高級總監(jiān)Dieter Fox(也是華盛頓大學(xué)教授)所言,該團(tuán)隊希望能讓下一代機(jī)器人安全地在接近人類的地方工作,但要做到這一點(diǎn),這些機(jī)器人需要能夠探測到人,追蹤他們的活動,并學(xué)習(xí)人類如何幫助他人,這可能是在小規(guī)模的工業(yè)環(huán)境中或者在某人的家里實(shí)現(xiàn)。

英偉達(dá)教機(jī)器人向人類學(xué)習(xí),只看一遍就能成功模擬!

英偉達(dá)機(jī)器人高級總監(jiān)Dieter Fox

雖然有可能訓(xùn)練一種通過機(jī)械重復(fù)來玩電子游戲的算法,并能教會它從錯誤中學(xué)習(xí),但Fox認(rèn)為,這種訓(xùn)練機(jī)器人的方式可能會因?yàn)闄C(jī)器人要做決策的內(nèi)容太多而無法有效地完成。相反,由Stan Birchfield和Jonathan Tremblay領(lǐng)導(dǎo)的英偉達(dá)研究團(tuán)隊開發(fā)了一套新系統(tǒng),可以通過簡單觀察一個人的行為來教機(jī)器人執(zhí)行新任務(wù)

實(shí)驗(yàn)中的任務(wù)非常簡單,只需將幾個彩色的方塊堆起來就可以,但這也是讓人類快速教授機(jī)器人新任務(wù)過程中的重要一步。

英偉達(dá)教機(jī)器人向人類學(xué)習(xí),只看一遍就能成功模擬!

研究人員首先訓(xùn)練了一系列神經(jīng)網(wǎng)絡(luò)來檢測積木,并推斷積木之間的關(guān)系,然后生成一個程序來重復(fù)它所觀察到的人類堆積木的過程。研究人員說,這個新系統(tǒng)使機(jī)器人觀看現(xiàn)實(shí)世界中的一次演示,便能完成堆積木任務(wù)。

該系統(tǒng)的一個優(yōu)點(diǎn)是,它生成一個可讀的關(guān)于它所執(zhí)行步驟的描述,以便讓研究人員更容易地弄清楚錯誤發(fā)生的具體情況。

英偉達(dá)公司的Stan Birchfieldt稱,該團(tuán)隊的目標(biāo)是讓非專業(yè)人員對機(jī)器人進(jìn)行訓(xùn)練變得容易,而且很少有任務(wù)比實(shí)驗(yàn)中展示的堆積木任務(wù)更簡單。

在該實(shí)驗(yàn)中,正如英偉達(dá)團(tuán)隊在ICRA展示的那樣,有一臺攝影機(jī)負(fù)責(zé)觀看現(xiàn)場,人類只是走上前去,拿起積木并堆疊起來,然后讓機(jī)器人重復(fù)這個任務(wù)。這聽起來很簡單,但對于機(jī)器人來說,這是一項艱巨的任務(wù)。

英偉達(dá)教機(jī)器人向人類學(xué)習(xí),只看一遍就能成功模擬!

為了訓(xùn)練核心模型,該團(tuán)隊主要使用來自模擬環(huán)境的合成數(shù)據(jù),正如Birchfield和Fox強(qiáng)調(diào)的那樣,正是這些模擬使得機(jī)器人能夠進(jìn)行快速訓(xùn)練,畢竟,在現(xiàn)實(shí)世界中進(jìn)行訓(xùn)練的時間要長得多,而且可能會更加危險。對于大多數(shù)的任務(wù),都沒有現(xiàn)成的帶標(biāo)簽的訓(xùn)練數(shù)據(jù)。

“我們認(rèn)為,使用模擬技術(shù)是一種強(qiáng)大的范例,它將訓(xùn)練機(jī)器人完成以前不可能完成的事情,”Birchfield指出,F(xiàn)ox回應(yīng)了這一觀點(diǎn),并指出這種對模擬的需要是Nvidia認(rèn)為其硬件和軟件最適合這種研究的原因之一。

畢竟,這個訓(xùn)練過程有著非常強(qiáng)烈的視覺效果,而英偉達(dá)在圖形硬件方面的專業(yè)背景肯定會有所幫助。

Fox承認(rèn),還有很多研究要做(畢竟,大部分的模擬都不是實(shí)際情況),但至少這一理論的核心基礎(chǔ)已經(jīng)到位。

英偉達(dá)教機(jī)器人向人類學(xué)習(xí),只看一遍就能成功模擬!

未來,英偉達(dá)團(tuán)隊計劃擴(kuò)大機(jī)器人可以學(xué)習(xí)的任務(wù)范圍,以及描述這些任務(wù)所需的詞匯量。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-05-22
英偉達(dá)教機(jī)器人向人類學(xué)習(xí),只看一遍就能成功模擬!
英偉達(dá)西雅圖研究團(tuán)隊開發(fā)了一套新系統(tǒng),可以通過觀察一個人的行為來教機(jī)器人執(zhí)行新任務(wù)。機(jī)器人只需觀看一次便可成功模擬人類的簡單行為,讓機(jī)器人在充滿人類的地方工作,甚至可以向人類學(xué)習(xí)。

長按掃碼 閱讀全文