谷歌DeepMind推出全新本地化機器人AI模型:Gemini Robotics On-Device,開啟新的人工智能時代
在人工智能領域,谷歌DeepMind再次引領潮流,近日發(fā)布了全新的Gemini Robotics On-Device本地化機器人AI模型。這一模型憑借其獨特的視覺-語言-動作(VLA)架構,將AI技術引入本地機器人設備,開啟了新的可能。
Gemini Robotics On-Device模型基于視覺-語言-動作(VLA)架構,這是一種全新的、創(chuàng)新性的技術架構。該架構不僅能夠理解視覺信息,還能處理語言信息,并據(jù)此生成動作,從而實現(xiàn)對機器人的精確控制。這一技術突破的關鍵在于,它無需云端支持,即可獨立運行在機器人設備上,這意味著即使在復雜的網(wǎng)絡環(huán)境中,如醫(yī)療環(huán)境等,機器人也能實現(xiàn)低延遲的響應。
除了強大的技術能力,Gemini Robotics On-Device還具備完成高精度操作任務的能力。例如,打開包袋拉鏈、疊衣服、系鞋帶等任務,這對于實體機器人來說是一項重大的挑戰(zhàn)。而Gemini Robotics On-Device的出色表現(xiàn)證明了其有能力完成這些任務。此外,其雙機械臂設計也使其能夠適配各種類型的機器人,如ALOA、Franka FR3及Apollo人形機器人。
為了方便開發(fā)者使用,Gemini Robotics還提供了相應的開發(fā)適配工具包。開發(fā)者通過簡單的50-100次任務演示,即可快速定制新功能。同時,該模型還支持MuJoCo物理模擬器測試,為開發(fā)者提供了更多的可能性。
在安全性方面,Gemini Robotics On-Device也做得相當出色。通過Live API實施語義安全檢測,底層安全控制器管理動作力度與速度,以及開放的語義安全基準測試框架,確保了機器人的安全運行。
值得一提的是,Gemini Robotics On-Device模型借鑒了Gemini的多模態(tài)世界理解能力。如同Gemini能夠生成文本、代碼、圖像那樣,Gemini Robotics On-Device也能夠生成機器人動作。這種創(chuàng)新性的技術應用,無疑將為機器人領域帶來巨大的變革。
然而,目前該模型還處于測試階段,僅面向可信測試計劃的開發(fā)者開放。隨著Gemini 2.0架構的開發(fā)(目前處于Gemini 2.5的最新版本),我們有理由相信,未來Gemini Robotics On-Device將會廣泛應用于各種類型的機器人中,為我們的生活帶來更多的便利。
總的來說,谷歌DeepMind的Gemini Robotics On-Device本地化機器人AI模型以其獨特的技術架構和強大的功能,展示了人工智能在本地機器人設備中的應用潛力。它不僅有可能解決當前機器人技術面臨的網(wǎng)絡不穩(wěn)定、高精度操作等問題,還有望為醫(yī)療、工業(yè)、家庭等領域的機器人應用帶來革命性的變化。未來,我們期待看到更多基于Gemini Robotics On-Device的優(yōu)秀產(chǎn)品問世,共同開啟人工智能的新時代。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )