迄今最大規(guī)模的GTC China,黃仁勛亮出了什么“核彈”?

2019年12月16日-19日,一年一度的英偉達GPU技術(shù)峰會(NVIDIA GTC China 2019)在蘇州舉行。本屆GTC China也是史上最大規(guī)模的一次峰會,超過 6000名科學家、工程師、開發(fā)者與企業(yè)家參與。

12月18日上午,本屆GTC China迎來了最重磅的環(huán)節(jié):英偉達創(chuàng)始人兼首席執(zhí)行官黃仁勛的演講。黃仁勛果然沒有讓人失望,兩個小時的演講圍繞一個核心主題“加速計算”展開,涵蓋云游戲、RTX技術(shù)、基因測序、NVIDIA HPC for Arm、最新一代TensorRT 7、自動駕駛芯片NVIDIA DRIVE AGX Orin、機器人開放平臺Isaac7大環(huán)節(jié),集中展示了英偉達在圖形、HPC和AI方面的最新進展。

其中最“核彈”的當屬面向自動駕駛和機器人的芯片NVIDIA DRIVE AGX Orin,以及最新一代推理軟件開發(fā)套件NVIDIA TensorRT 7編譯器。

專注加速計算25年,英偉達越來越“軟”

“英偉達處在圖形計算、HPC和AI的交匯點。”

黃仁勛在演講中如是說。這是對英偉達產(chǎn)業(yè)鏈角色非常準確的定位。英偉達用一套統(tǒng)一的架構(gòu),借助通用型的GPU芯片,賦能從游戲、自動駕駛、到醫(yī)療、云計算數(shù)據(jù)中心在內(nèi)的廣泛的智能應用場景。

迄今為止,英偉達已經(jīng)售出了15億塊GPU芯片。但是,在演講和媒體采訪中,黃仁勛一再強調(diào)英偉達無比注重軟件,今天發(fā)布的新品中只有一款硬件芯片,其他都是軟件套件、軟件平臺和軟件應用。

通過軟件棧的改進提升GPU性能,英偉達讓深度學習訓練在3年內(nèi)提高4倍,深度學習推理在1年內(nèi)提高了2倍。

會上,英偉達AI芯片家族,包括面向訓練的DGX系列,面向超大規(guī)模云的HGX系列,面向IOT和邊緣的EGX系列,以及面向自動駕駛和自主機器人系統(tǒng)的AGX系列。英偉達AI芯片從云到邊緣,覆蓋各行各業(yè)。

當被問到英偉達何時推出7nm制程的芯片時,黃仁勛表示,制程對芯片性能很重要,但不是最關(guān)鍵的。加速計算的時代和CPU時代不同,如何讓芯片達到最高性能有很多因素,首先是架構(gòu),然后要有算法、軟件、應用的共同合力提升性能。去年英偉達發(fā)布的圖靈架構(gòu)的芯片就是12nm,但依然性能強勁。

7倍Xavier性能的自動駕駛芯片Orin

黃仁勛一直強調(diào),未來的自動駕駛系統(tǒng)是軟件定義。此次發(fā)布的自動駕駛芯片Orin正是這樣可擴展、可編程、軟件定義的AI平臺。

Orin擁有多達170億個晶體管、8核64位CPU,200TOPS的深度學習能力,是前代Xavier的7倍。Orin兼具了高性能和軟件定義,易于編程,而且與Xavier相兼容。Orin具有很強的擴展性,適用于從L2到L5級自動駕駛開發(fā)。Orin計劃于2022年開始投產(chǎn)。

會上,黃仁勛還宣布與共享出行巨頭滴滴深度合作。滴滴將在數(shù)據(jù)中心使用NVIDIA?GPU訓練機器學習算法,并采用NVIDIA DRIVE為其L4級自動駕駛汽車提供推理能力。據(jù)悉,滴滴將很快在上海開始基于NVIDIA DRIVE技術(shù)的測試車隊。

NVIDIA DRIVE的全球生態(tài)系統(tǒng)日益龐大,幾乎每家自動駕駛汽車領(lǐng)域的企業(yè),都在其計算堆棧中使用NVIDIA的解決方案。面向汽車制造商、卡車制造商、自動駕駛出租車公司、軟件公司和大學等眾多合作伙伴,英偉達為其提供了端到端的基礎設施、訓練模型、開放的軟件開發(fā)平臺以及豐富的測試模型。

現(xiàn)場,黃仁勛還展示了一段NVIDIA DRIVE自動駕駛在美國實際道路行駛的demo。NVIDIA DRIVE借助多個深度神經(jīng)網(wǎng)絡融合來自各類傳感器(攝像頭、激光雷達、雷達等)的數(shù)據(jù),能夠?qū)崿F(xiàn)對汽車周圍環(huán)境360度全方位的理解。自動駕駛車輛不但順利完成遵守交通燈、變道、進出匝道、會車等動作,初次行駛的道路,還會自動生成動態(tài)地圖,加入到車輛地圖庫中。

阿里、百度推薦系統(tǒng)背后的TensorRT 7

此次,英偉達發(fā)布了第七代推理軟件開發(fā)套件NVIDIA TensorRT 7編譯器。會話AI是TensorRT 7的典型應用場景。

與在CPU上運行時相比,會話式AI組件速度提高了10倍以上,從而將延遲降低到實時交互所需的300毫秒閾值以下,讓語音助手與人類的實時交互成為可能。目前,阿里巴巴、百度、滴滴出行、美團、快手、平安、搜狗、騰訊和字節(jié)跳動等頭部互聯(lián)網(wǎng)公司都在使用TensorRT 7的會話式AI加速功能。

會話AI之外,深度推薦系統(tǒng)(Deep Recommender Systems)也是TensorRT 7的一大應用場景。

信息爆炸時代,互聯(lián)網(wǎng)上的新聞、商品、內(nèi)容呈井噴態(tài)勢,每一個使用互聯(lián)網(wǎng)的用戶每一次找到所需的內(nèi)容都要靠推薦系統(tǒng)。推薦系統(tǒng)可以說是互聯(lián)網(wǎng)發(fā)展的引擎。海量數(shù)據(jù)的不斷增加,深度技術(shù)的發(fā)展,讓深度推薦系統(tǒng)成為互聯(lián)網(wǎng)公司的標配。黃仁勛介紹,目前互聯(lián)網(wǎng)巨頭的推薦系統(tǒng)正在從過去基于CPU轉(zhuǎn)為基于GPU。

目前,NVIDIA AI的100多個推薦模型被應用到百度的多款應用中。用GPU訓練深度推薦系統(tǒng),成本只有CPU的十分之一。

阿里巴巴的推薦系統(tǒng)同樣使用的是NVIDIA AI。此前基于CPU,每秒查詢率(QPS,Queries-per-second)只有3次,NVIDIA AI則提升到了每秒780次查詢。

此外,黃仁勛還在演講中展示了在游戲、建筑、基因測序等應用領(lǐng)域,英偉達GPU生態(tài)的進一步擴展。

英偉達GPU技術(shù)為騰訊游戲的START云游戲服務賦力。同時,去年發(fā)布的RTX(實時光線追蹤,Real Time Ray Tracing)技術(shù)也進一步落地。借助英偉達RTX技術(shù),一個人組成的工作室也能制作出逼真的光影和反射效果。

今年3月,英偉達在GTC全球峰會上發(fā)布了基于RTX技術(shù)發(fā)布了實時的3D制作協(xié)作平臺NVIDA OMNIVERSE。今天,英偉達發(fā)布了面向建筑行業(yè)的NVIDA OMNIVERSE。

此次,英偉達還發(fā)布了NVIDA基因組分析工具包Parabricks,其可以利用深度學習技術(shù)進行基因變異檢測。目前華大基因已經(jīng)采用Parabricks,借助若干GPU服務器,可以大大加速處理基因組的速度。

回顧下來,一個架構(gòu)、軟件定義、加速運算成為本屆GTC China的關(guān)鍵詞。本屆GTC,英偉達多強力釋放了一種聲音:通過多項創(chuàng)新技術(shù)與生態(tài)合作全面加速AI落地。

免責聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-12-18
迄今最大規(guī)模的GTC China,黃仁勛亮出了什么“核彈”?
2019年12月16日-19日,一年一度的英偉達GPU技術(shù)峰會(NVIDIAGTCChina2019)在蘇州舉行。本屆GTCChina也是史上最大規(guī)模的一次峰會,超過6000名科學家、工程師、開發(fā)者與企業(yè)家參與。

長按掃碼 閱讀全文