解碼機(jī)器人技術(shù)未來:英偉達(dá)推動智能與產(chǎn)業(yè)融合

ChatGPT 標(biāo)志著生成式 AI 的大爆炸時刻正在開啟。在剛剛過去的CES2025上,NVIDIA (英偉達(dá))創(chuàng)始人兼CEO黃仁勛在演講中提到,人形機(jī)器人的時代即將到來。

作為全球領(lǐng)先的算力提供商,NVIDIA在機(jī)器人領(lǐng)域投入布局巨大,著手迎接“通用機(jī)器人的ChatGPT時刻”。

當(dāng)前,生成式 AI 發(fā)展火熱,但 AI 在人形機(jī)器人、工廠和其它工業(yè)系統(tǒng)設(shè)備中的具象化體現(xiàn)尚未達(dá)到突破點(diǎn)。這阻礙了運(yùn)輸和移動、制造業(yè)、物流和機(jī)器人等行業(yè)的發(fā)展。

三大驅(qū)動力:機(jī)器人技術(shù)需求的源泉

相關(guān)數(shù)據(jù)顯示,未來二十年,預(yù)計人形機(jī)器人市場將達(dá)到 380 億美元。為了滿足這一巨大需求,尤其是工業(yè)和制造業(yè)領(lǐng)域的需求,NVIDIA 發(fā)布了一系列機(jī)器人基礎(chǔ)模型、數(shù)據(jù)管線和仿真框架,以加速下一代人形機(jī)器人的開發(fā)進(jìn)程。

在2025年的技術(shù)浪潮中,機(jī)器人正迅速成為解決社會和產(chǎn)業(yè)需求的關(guān)鍵工具。NVIDIA機(jī)器人與邊緣計算副總裁Deepu Talla在近期分享中,深刻闡述了機(jī)器人技術(shù)發(fā)展的驅(qū)動力、技術(shù)突破與未來應(yīng)用,揭示了這一領(lǐng)域的巨大潛力與挑戰(zhàn)。

Deepu Talla認(rèn)為,指出,機(jī)器人技術(shù)的快速發(fā)展背后有三大核心驅(qū)動力:

1. 危險工作:在采礦等高危環(huán)境中,機(jī)器人可以替代人類承擔(dān)風(fēng)險,確保人員安全。

2. 勞動力短缺:社會職業(yè)結(jié)構(gòu)的變化導(dǎo)致勞動力逐步減少,機(jī)器人可以填補(bǔ)這一空白。

3. 養(yǎng)老需求:隨著全球平均壽命的延長,對護(hù)理和陪伴機(jī)器人的需求日益增長,機(jī)器人能夠成為有效的“社會伴侶”。

這三大需求共同推動機(jī)器人技術(shù)成為現(xiàn)代社會不可或缺的組成部分。

關(guān)鍵突破:機(jī)器人技術(shù)發(fā)展的轉(zhuǎn)折點(diǎn)

Deepu Talla強(qiáng)調(diào),過去12個月中,機(jī)器人技術(shù)經(jīng)歷了兩大關(guān)鍵突破:

1. 生成式AI(GenAI)的引入:兩年前,大型語言模型(LLMs)顛覆了數(shù)字應(yīng)用,如今這些技術(shù)被應(yīng)用到機(jī)器人領(lǐng)域,成功連接了數(shù)字與物理應(yīng)用。

2. 仿真環(huán)境的成熟:以NVIDIA Omniverse為代表的仿真技術(shù)提供了高精度的虛擬環(huán)境,使機(jī)器人測試從依賴真實(shí)世界轉(zhuǎn)向虛擬測試,大幅降低了成本和時間消耗。

這些技術(shù)突破顯著加快了機(jī)器人開發(fā)的進(jìn)程,也為更多企業(yè)投入機(jī)器人研發(fā)提供了契機(jī)。

三臺計算機(jī),解決機(jī)器人挑戰(zhàn)

為了真正解決機(jī)器人領(lǐng)域的挑戰(zhàn),我們需要三臺計算機(jī)?!?Deepu Talla如是說。

第一臺計算機(jī)用于訓(xùn)練:這是用于訓(xùn)練AI模型的系統(tǒng)。訓(xùn)練通常在云端、數(shù)據(jù)中心或像NVIDIA DGX這樣的強(qiáng)大系統(tǒng)上進(jìn)行。這是構(gòu)建機(jī)器人“大腦”的關(guān)鍵步驟。

第二臺計算機(jī)用于仿真:一旦訓(xùn)練完成,就需要進(jìn)行測試。以往的標(biāo)準(zhǔn)是物理測試,但這種方式既慢又昂貴,還存在風(fēng)險。更好的解決方案是引入一個“仿真層”,即“數(shù)字孿生”(Digital Twin),在虛擬環(huán)境中完成測試。仿真允許在大規(guī)模、快速且安全的條件下運(yùn)行數(shù)千種場景測試,無需受到真實(shí)世界時間或成本的限制。

第三臺計算機(jī)用于部署:它安裝在機(jī)器人內(nèi)部,就是操作物理機(jī)器人的“大腦”。對NVIDIA來說,這可以通過像Jetson或AGX這樣的系統(tǒng)來實(shí)現(xiàn)。

通過將訓(xùn)練、仿真、部署的循環(huán)過程,使得機(jī)器人技術(shù)進(jìn)步從50年縮短到了5年,顯著縮短機(jī)器人的開發(fā)周期。Deepu Talla對此解釋,在將機(jī)器人部署至現(xiàn)實(shí)世界前,利用仿真系統(tǒng)開展成千上萬次測試,可有效加速整個開發(fā)流程。倘若某個設(shè)計在現(xiàn)實(shí)應(yīng)用中表現(xiàn)欠佳,便可返回仿真環(huán)境對模型進(jìn)行優(yōu)化,之后再次測試。

這種開發(fā)方法也解釋了機(jī)器人技術(shù)相較于自動駕駛技術(shù)難度更高的原因。自動駕駛主要聚焦于躲避障礙物和保障行駛安全,無需與物理物體產(chǎn)生直接交互。而機(jī)器人領(lǐng)域則涉及與物體的接觸、碰撞以及復(fù)雜的物理互動,這些環(huán)節(jié)的測試與優(yōu)化難度極大。

仿真并非一個新概念。在芯片領(lǐng)域,仿真就早已進(jìn)入了大規(guī)模生產(chǎn)之中,因?yàn)樾酒O(shè)計一旦出現(xiàn)錯誤,可能會導(dǎo)致項目延誤數(shù)月,造成數(shù)百萬甚至數(shù)十億美元的損失。所以,這樣來看,給機(jī)器人仿真,也具備一定可行性。

不過,在機(jī)器人領(lǐng)域,仿真的主要的挑戰(zhàn)在于 “仿真與現(xiàn)實(shí)的差距”(sim-to-real gap),即仿真結(jié)果與實(shí)際表現(xiàn)之間存在差異。在過去,由于仿真技術(shù)精度有限,該技術(shù)并未得到廣泛應(yīng)用。然而,諸如 Omniverse 等技術(shù)的出現(xiàn),顯著縮小了這一差距。盡管目前這一差距尚未完全消除,但技術(shù)的改進(jìn)程度已足以使仿真成為機(jī)器人開發(fā)中可行且有效的工具。

據(jù)了解, NVIDIA 并不直接參與機(jī)器人的制造環(huán)節(jié),而是選擇與所有投身于機(jī)器人制造以及機(jī)器人解決方案開發(fā)的專業(yè)人員展開合作。當(dāng)前,NVIDIA 正在搭建一個綜合性平臺,該平臺涵蓋了訓(xùn)練、仿真、部署三種計算系統(tǒng),以及與之相關(guān)的軟件工具和工作流程。其目的在于助力機(jī)器人專家、研究人員、機(jī)械工程師和測試人員能夠更為便捷地開發(fā)機(jī)器人解決方案,通過簡化流程和提高效率,加速機(jī)器人技術(shù)的研發(fā)進(jìn)程。

機(jī)器人技術(shù)的另一個核心挑戰(zhàn)在于數(shù)據(jù)的獲取與生成。Deepu指出,與自動駕駛汽車依賴現(xiàn)有車輛生成海量數(shù)據(jù)不同,當(dāng)前機(jī)器人的數(shù)量遠(yuǎn)不足以滿足訓(xùn)練需求。為此,NVIDIA采用了以下解決方案:

1. 合成數(shù)據(jù)生成:通過工具(如NVIDIA Cosmos)創(chuàng)建逼真的虛擬環(huán)境,生成多樣化的機(jī)器人交互數(shù)據(jù)。

2. 結(jié)合真實(shí)與合成數(shù)據(jù):整合少量真實(shí)數(shù)據(jù)與大規(guī)模合成數(shù)據(jù),形成高效的數(shù)據(jù)工作流,滿足訓(xùn)練與測試需求。

3. 仿真與現(xiàn)實(shí)結(jié)合的優(yōu)化:克服“仿真與現(xiàn)實(shí)的差距”(sim-to-real gap),通過高精度仿真提升現(xiàn)實(shí)應(yīng)用的準(zhǔn)確性。

這一數(shù)據(jù)生成與整合方案不僅解決了數(shù)據(jù)稀缺問題,還大幅加快了機(jī)器人技術(shù)的開發(fā)進(jìn)程。

在分享會上,銀河通用創(chuàng)始人、CTO王鶴分享了其在與英偉達(dá)合作取得的進(jìn)展。他表示,我們使用NVIDIA Isaac系列以及現(xiàn)在的Omniverse等,積極探索使用仿真器合成大量的機(jī)器人操作數(shù)據(jù),并將其轉(zhuǎn)化為機(jī)器人的模型。我們將各種 3D 固體資產(chǎn)、環(huán)境以及各類材質(zhì)和紋理素材相互融合,模擬機(jī)器人的運(yùn)行場景,探討機(jī)器人如何操作物體。

銀河通用憑借具身大模型,已經(jīng)成功涉足眾多行業(yè),涵蓋零售、酒店、接待、養(yǎng)老以及工業(yè)制造等領(lǐng)域。在北京奔馳的工廠里,我們可以看到銀河通用的人形機(jī)器人在人工裝載天窗玻璃及轉(zhuǎn)運(yùn)過程中發(fā)揮著重要作用。在這個過程中,天窗玻璃在吸起和放下時容易出現(xiàn)錯誤擺放,一旦出現(xiàn)這種情況,以往需要人工終止轉(zhuǎn)運(yùn)并進(jìn)行修正。而現(xiàn)在,人形機(jī)器人基于視覺閉環(huán)和從仿真中學(xué)到的操作技能,經(jīng)過良好訓(xùn)練后,能夠快速發(fā)現(xiàn)錯誤并進(jìn)行有目的的糾正。大家可以觀看這個視頻,視頻中人形機(jī)器人在搬運(yùn)場景中的表現(xiàn)十分出色,面對 3×3×327 箱緊密排列的設(shè)備,人形機(jī)器人能夠在貨箱間高效搬運(yùn)。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2025-01-24
解碼機(jī)器人技術(shù)未來:英偉達(dá)推動智能與產(chǎn)業(yè)融合
三大驅(qū)動力:機(jī)器人技術(shù)需求的源泉相關(guān)數(shù)據(jù)顯示,未來二十年,預(yù)計人形機(jī)器人市場將達(dá)到 380 億美元。這三大需求共同推動機(jī)器人技術(shù)成為現(xiàn)代社會不可或缺的組成部分。這種開發(fā)方法也解釋了機(jī)器人技術(shù)相較于自動駕駛技術(shù)難度更高的原因。據(jù)了解, NVIDIA 并不直接參與機(jī)器人的制造環(huán)節(jié),而是選擇與所有投身于機(jī)器人制造以及機(jī)器人解決方案開發(fā)的專業(yè)人員展開合作。機(jī)器人技術(shù)的另一個核心挑戰(zhàn)在于數(shù)據(jù)的獲取與生成。

長按掃碼 閱讀全文