高層速讀
IBM Research 宣布他們使用一組由 Criteo Labs發(fā)布的40多億個廣告數(shù)據(jù)集來訓練邏輯回歸分類器,在POWER9服務器和GPU上運行自身機器學習庫Snap ML,能夠在91.5秒內(nèi)訓練出邏輯回歸分類器,比之前谷歌的最佳結(jié)果快46倍。
IBM希望讓機器學習的速度和打響指的速度一樣快。
在IBM THINK會議上,IBM Research 宣布他們使用一組由 Criteo Labs發(fā)布的40多億個廣告數(shù)據(jù)集來訓練邏輯回歸分類器,在POWER9服務器和GPU上運行自身機器學習庫Snap ML,能夠在91.5秒內(nèi)訓練出邏輯回歸分類器,比之前谷歌的最佳結(jié)果快46倍,后者在Google Cloud平臺上使用TensorFlow在70分鐘內(nèi)訓練出相同的模型。
IBM研究公司負責非易失性存儲器的經(jīng)理Haris Pozidis在接受一家媒體采訪時表示,這篇論文概述的結(jié)果是最近幾年研究的頂峰。Pozidis說:“當我們開始做這件事情的時候,是為了使機器學習更容易被人們接受,并且使機器學習比過去和現(xiàn)在快得多。”
這個由人工智能軟件提供動力的新庫被稱為IBM Snap Machine Learning(簡稱Snap ML),因為它訓練模型的速度“比你打拍子的速度快”,它為現(xiàn)代CPU/GPU計算系統(tǒng)上流行的機器學習模型提供了高速訓練。由此帶來的好處包括降低了用戶的云成本、減少了精力投入和縮短了實現(xiàn)時間。
IBM的Snap ML有三個核心元素
分布式培訓:該系統(tǒng)是作為一個數(shù)據(jù)并行框架構建的,能夠在大型數(shù)據(jù)集上進行擴展和訓練,這對于大型應用程序是至關重要的。
GPU加速:IBM使用專門的解決方案來利用GPU的大規(guī)模并行體系結(jié)構,同時尊重GPU內(nèi)存中的數(shù)據(jù)局部性,以避免大量的數(shù)據(jù)傳輸開銷。它還利用了最近在異構學習方面的發(fā)展,使其具有可伸縮性,即使可以存儲在加速器內(nèi)存中的數(shù)據(jù)只有一小部分,也可以實現(xiàn)GPU加速。
稀疏數(shù)據(jù)結(jié)構:在認識到了人機學習數(shù)據(jù)集是稀疏的基礎上,IBM的系統(tǒng)對算法進行了新的優(yōu)化。
IBM研究數(shù)學家Thomas Parnell說:“大多數(shù)機器都具有異構的計算基礎設施,但是我們分配培訓的方式,在某種程度上是為了減少培訓的不同模式之間必須進行的交流,這使我們能夠避免通過網(wǎng)絡傳送大量數(shù)據(jù)的開銷?!?/p>
Parnell說,對稀疏數(shù)據(jù)結(jié)構的支持是相當新穎的,在研究論文中進一步概述了這一點,并與現(xiàn)有的用于執(zhí)行這類任務的庫進行了一些比較。
特別地,IBM研究了Google的TensorFlow框架,該框架主要關注大規(guī)模線性模型上的機器學習?!癟ensorFlow非常靈活,”Parnell說,“它可以支持GPU加速,還可以從多個節(jié)點擴展。但我們發(fā)現(xiàn)TensorFlow的缺點之一是它對稀疏數(shù)據(jù)結(jié)構的支持相對有限?!?/p>
IBM研究人員的另一個發(fā)現(xiàn)是,在為這樣大規(guī)模的應用程序部署GPU加速時,由于訓練數(shù)據(jù)太大,而無法存儲在GPU可用的內(nèi)存中。這意味著在訓練期間,需要有選擇地處理數(shù)據(jù),并反復地將數(shù)據(jù)移入和移出GPU內(nèi)存。
在論文中,研究人員還探索了不同層次的平行性,IBM的研究員Celestine Duenner說:“第一個層次是將工作負載分布在集群中的不同節(jié)點上,第二層是在一個節(jié)點內(nèi)的不同計算單元之間分配工作負載,第三層是使用單個計算單元提供的所有并行性?!?/p>
通信必須通過網(wǎng)絡進行,但是可以對不適合單個機器內(nèi)存的大型數(shù)據(jù)集進行訓練?!拔覀兪褂梅植际脚嘤?,這樣我們就可以使用多臺機器的聚合內(nèi)存,”Duenner說,“我們使用最先進的技術來組織節(jié)點之間的工作,實現(xiàn)有效的通信?!?/p>
Parnell說,IBM最終的目標是加快機器學習的速度,并使計算機基礎設施能夠盡快商業(yè)化。他說:“訓練時間的長短非常關鍵,因為云實例通常按小時計費,因此您使用它們的時間越長,您為它們支付的費用就越多。”
預計今年下半年,作為Power AI技術組合的一部分,IBM Research所研究的成果將能夠商業(yè)化,IBM目前正在尋找對試點項目感興趣的客戶。
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計劃瞄準AI機器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費引熱議
- 消息稱塔塔集團將收購和碩印度iPhone代工廠60%股份 并接管日常運營
- 蘋果揭秘自研芯片成功之道:領先技術與深度整合是關鍵
- 英偉達新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關注
- 無人機“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機器人合作
- 賽力斯觸及漲停,汽車整車股盤初強勢拉升
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。