ChatGPT 標(biāo)志著生成式 AI 的大爆炸時刻正在開啟。在剛剛過去的CES2025上,NVIDIA (英偉達(dá))創(chuàng)始人兼CEO黃仁勛在演講中提到,人形機(jī)器人的時代即將到來。
作為全球領(lǐng)先的算力提供商,NVIDIA在機(jī)器人領(lǐng)域投入布局巨大,著手迎接“通用機(jī)器人的ChatGPT時刻”。
當(dāng)前,生成式 AI 發(fā)展火熱,但 AI 在人形機(jī)器人、工廠和其它工業(yè)系統(tǒng)設(shè)備中的具象化體現(xiàn)尚未達(dá)到突破點(diǎn)。這阻礙了運(yùn)輸和移動、制造業(yè)、物流和機(jī)器人等行業(yè)的發(fā)展。
三大驅(qū)動力:機(jī)器人技術(shù)需求的源泉
相關(guān)數(shù)據(jù)顯示,未來二十年,預(yù)計人形機(jī)器人市場將達(dá)到 380 億美元。為了滿足這一巨大需求,尤其是工業(yè)和制造業(yè)領(lǐng)域的需求,NVIDIA 發(fā)布了一系列機(jī)器人基礎(chǔ)模型、數(shù)據(jù)管線和仿真框架,以加速下一代人形機(jī)器人的開發(fā)進(jìn)程。
在2025年的技術(shù)浪潮中,機(jī)器人正迅速成為解決社會和產(chǎn)業(yè)需求的關(guān)鍵工具。NVIDIA機(jī)器人與邊緣計算副總裁Deepu Talla在近期分享中,深刻闡述了機(jī)器人技術(shù)發(fā)展的驅(qū)動力、技術(shù)突破與未來應(yīng)用,揭示了這一領(lǐng)域的巨大潛力與挑戰(zhàn)。
Deepu Talla認(rèn)為,指出,機(jī)器人技術(shù)的快速發(fā)展背后有三大核心驅(qū)動力:
1. 危險工作:在采礦等高危環(huán)境中,機(jī)器人可以替代人類承擔(dān)風(fēng)險,確保人員安全。
2. 勞動力短缺:社會職業(yè)結(jié)構(gòu)的變化導(dǎo)致勞動力逐步減少,機(jī)器人可以填補(bǔ)這一空白。
3. 養(yǎng)老需求:隨著全球平均壽命的延長,對護(hù)理和陪伴機(jī)器人的需求日益增長,機(jī)器人能夠成為有效的“社會伴侶”。
這三大需求共同推動機(jī)器人技術(shù)成為現(xiàn)代社會不可或缺的組成部分。
關(guān)鍵突破:機(jī)器人技術(shù)發(fā)展的轉(zhuǎn)折點(diǎn)
Deepu Talla強(qiáng)調(diào),過去12個月中,機(jī)器人技術(shù)經(jīng)歷了兩大關(guān)鍵突破:
1. 生成式AI(GenAI)的引入:兩年前,大型語言模型(LLMs)顛覆了數(shù)字應(yīng)用,如今這些技術(shù)被應(yīng)用到機(jī)器人領(lǐng)域,成功連接了數(shù)字與物理應(yīng)用。
2. 仿真環(huán)境的成熟:以NVIDIA Omniverse為代表的仿真技術(shù)提供了高精度的虛擬環(huán)境,使機(jī)器人測試從依賴真實(shí)世界轉(zhuǎn)向虛擬測試,大幅降低了成本和時間消耗。
這些技術(shù)突破顯著加快了機(jī)器人開發(fā)的進(jìn)程,也為更多企業(yè)投入機(jī)器人研發(fā)提供了契機(jī)。
三臺計算機(jī),解決機(jī)器人挑戰(zhàn)
為了真正解決機(jī)器人領(lǐng)域的挑戰(zhàn),我們需要三臺計算機(jī)?!?Deepu Talla如是說。
第一臺計算機(jī)用于訓(xùn)練:這是用于訓(xùn)練AI模型的系統(tǒng)。訓(xùn)練通常在云端、數(shù)據(jù)中心或像NVIDIA DGX這樣的強(qiáng)大系統(tǒng)上進(jìn)行。這是構(gòu)建機(jī)器人“大腦”的關(guān)鍵步驟。
第二臺計算機(jī)用于仿真:一旦訓(xùn)練完成,就需要進(jìn)行測試。以往的標(biāo)準(zhǔn)是物理測試,但這種方式既慢又昂貴,還存在風(fēng)險。更好的解決方案是引入一個“仿真層”,即“數(shù)字孿生”(Digital Twin),在虛擬環(huán)境中完成測試。仿真允許在大規(guī)模、快速且安全的條件下運(yùn)行數(shù)千種場景測試,無需受到真實(shí)世界時間或成本的限制。
第三臺計算機(jī)用于部署:它安裝在機(jī)器人內(nèi)部,就是操作物理機(jī)器人的“大腦”。對NVIDIA來說,這可以通過像Jetson或AGX這樣的系統(tǒng)來實(shí)現(xiàn)。
通過將訓(xùn)練、仿真、部署的循環(huán)過程,使得機(jī)器人技術(shù)進(jìn)步從50年縮短到了5年,顯著縮短機(jī)器人的開發(fā)周期。Deepu Talla對此解釋,在將機(jī)器人部署至現(xiàn)實(shí)世界前,利用仿真系統(tǒng)開展成千上萬次測試,可有效加速整個開發(fā)流程。倘若某個設(shè)計在現(xiàn)實(shí)應(yīng)用中表現(xiàn)欠佳,便可返回仿真環(huán)境對模型進(jìn)行優(yōu)化,之后再次測試。
這種開發(fā)方法也解釋了機(jī)器人技術(shù)相較于自動駕駛技術(shù)難度更高的原因。自動駕駛主要聚焦于躲避障礙物和保障行駛安全,無需與物理物體產(chǎn)生直接交互。而機(jī)器人領(lǐng)域則涉及與物體的接觸、碰撞以及復(fù)雜的物理互動,這些環(huán)節(jié)的測試與優(yōu)化難度極大。
仿真并非一個新概念。在芯片領(lǐng)域,仿真就早已進(jìn)入了大規(guī)模生產(chǎn)之中,因?yàn)樾酒O(shè)計一旦出現(xiàn)錯誤,可能會導(dǎo)致項目延誤數(shù)月,造成數(shù)百萬甚至數(shù)十億美元的損失。所以,這樣來看,給機(jī)器人仿真,也具備一定可行性。
不過,在機(jī)器人領(lǐng)域,仿真的主要的挑戰(zhàn)在于 “仿真與現(xiàn)實(shí)的差距”(sim-to-real gap),即仿真結(jié)果與實(shí)際表現(xiàn)之間存在差異。在過去,由于仿真技術(shù)精度有限,該技術(shù)并未得到廣泛應(yīng)用。然而,諸如 Omniverse 等技術(shù)的出現(xiàn),顯著縮小了這一差距。盡管目前這一差距尚未完全消除,但技術(shù)的改進(jìn)程度已足以使仿真成為機(jī)器人開發(fā)中可行且有效的工具。
據(jù)了解, NVIDIA 并不直接參與機(jī)器人的制造環(huán)節(jié),而是選擇與所有投身于機(jī)器人制造以及機(jī)器人解決方案開發(fā)的專業(yè)人員展開合作。當(dāng)前,NVIDIA 正在搭建一個綜合性平臺,該平臺涵蓋了訓(xùn)練、仿真、部署三種計算系統(tǒng),以及與之相關(guān)的軟件工具和工作流程。其目的在于助力機(jī)器人專家、研究人員、機(jī)械工程師和測試人員能夠更為便捷地開發(fā)機(jī)器人解決方案,通過簡化流程和提高效率,加速機(jī)器人技術(shù)的研發(fā)進(jìn)程。
機(jī)器人技術(shù)的另一個核心挑戰(zhàn)在于數(shù)據(jù)的獲取與生成。Deepu指出,與自動駕駛汽車依賴現(xiàn)有車輛生成海量數(shù)據(jù)不同,當(dāng)前機(jī)器人的數(shù)量遠(yuǎn)不足以滿足訓(xùn)練需求。為此,NVIDIA采用了以下解決方案:
1. 合成數(shù)據(jù)生成:通過工具(如NVIDIA Cosmos)創(chuàng)建逼真的虛擬環(huán)境,生成多樣化的機(jī)器人交互數(shù)據(jù)。
2. 結(jié)合真實(shí)與合成數(shù)據(jù):整合少量真實(shí)數(shù)據(jù)與大規(guī)模合成數(shù)據(jù),形成高效的數(shù)據(jù)工作流,滿足訓(xùn)練與測試需求。
3. 仿真與現(xiàn)實(shí)結(jié)合的優(yōu)化:克服“仿真與現(xiàn)實(shí)的差距”(sim-to-real gap),通過高精度仿真提升現(xiàn)實(shí)應(yīng)用的準(zhǔn)確性。
這一數(shù)據(jù)生成與整合方案不僅解決了數(shù)據(jù)稀缺問題,還大幅加快了機(jī)器人技術(shù)的開發(fā)進(jìn)程。
在分享會上,銀河通用創(chuàng)始人、CTO王鶴分享了其在與英偉達(dá)合作取得的進(jìn)展。他表示,我們使用NVIDIA Isaac系列以及現(xiàn)在的Omniverse等,積極探索使用仿真器合成大量的機(jī)器人操作數(shù)據(jù),并將其轉(zhuǎn)化為機(jī)器人的模型。我們將各種 3D 固體資產(chǎn)、環(huán)境以及各類材質(zhì)和紋理素材相互融合,模擬機(jī)器人的運(yùn)行場景,探討機(jī)器人如何操作物體。
銀河通用憑借具身大模型,已經(jīng)成功涉足眾多行業(yè),涵蓋零售、酒店、接待、養(yǎng)老以及工業(yè)制造等領(lǐng)域。在北京奔馳的工廠里,我們可以看到銀河通用的人形機(jī)器人在人工裝載天窗玻璃及轉(zhuǎn)運(yùn)過程中發(fā)揮著重要作用。在這個過程中,天窗玻璃在吸起和放下時容易出現(xiàn)錯誤擺放,一旦出現(xiàn)這種情況,以往需要人工終止轉(zhuǎn)運(yùn)并進(jìn)行修正。而現(xiàn)在,人形機(jī)器人基于視覺閉環(huán)和從仿真中學(xué)到的操作技能,經(jīng)過良好訓(xùn)練后,能夠快速發(fā)現(xiàn)錯誤并進(jìn)行有目的的糾正。大家可以觀看這個視頻,視頻中人形機(jī)器人在搬運(yùn)場景中的表現(xiàn)十分出色,面對 3×3×327 箱緊密排列的設(shè)備,人形機(jī)器人能夠在貨箱間高效搬運(yùn)。
- 獨(dú)家對話尚網(wǎng)網(wǎng)絡(luò)CEO朱立華:再造線下經(jīng)濟(jì)新繁榮
- 消息稱智譜管理層變動 2名高管離職
- SM娛樂單方面通知網(wǎng)易云音樂不續(xù)約 行業(yè)預(yù)估波及數(shù)百萬用戶
- 特斯拉中國召回超120萬輛進(jìn)口及國產(chǎn)汽車
- 小米首次召回3.1萬輛SU7標(biāo)準(zhǔn)版車型 OTA升級即可解決
- 解碼機(jī)器人技術(shù)未來:英偉達(dá)推動智能與產(chǎn)業(yè)融合
- 網(wǎng)易云音樂或?qū)⑾录躍M娛樂版權(quán)歌曲 行業(yè)預(yù)估波及數(shù)百萬用戶
- 百川智能發(fā)布全場景深度思考模型Baichuan-M1-preview:聚齊三大推理能力,解鎖醫(yī)療循證模式
- 抖音上線打車服務(wù) 目前僅高德打車一家入駐
- 好未來2025財年第三季度凈利潤2310萬美元,同比扭虧
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。