AMD全面發(fā)力AI芯片挑戰(zhàn)英偉達(dá),差距還有多大?

極客網(wǎng)·芯片7月5日 AMD制造的AI芯片“幾乎”與業(yè)界領(lǐng)先的英偉達(dá)AI芯片一樣快。這是根據(jù)Databricks旗下的AI軟件開發(fā)商MosaicML的一項研究得出的結(jié)論。研究發(fā)現(xiàn),在訓(xùn)練大型語言模型和執(zhí)行其他AI密集型任務(wù)時,AMD的AI芯片達(dá)到了英偉達(dá)同類產(chǎn)品的80%。

AMD全面發(fā)力AI芯片挑戰(zhàn)英偉達(dá),差距還有多大?.jpg

MosaicML將AMD MI250與Nvidia A100進(jìn)行了對比,并訓(xùn)練了不同大小的大型語言模型

英偉達(dá)的芯片目前在訓(xùn)練AI模型(例如用于運行ChatGPT或Midjourney的模型)方面占據(jù)主導(dǎo)地位。這些產(chǎn)品的成功和對計算能力的需求將英偉達(dá)的估值推至1萬億美元,并引發(fā)了GPU的短缺。

MosaicML對比測試AMD的M1250 GPU與英偉達(dá)的A100 GPU

MosaicML最近將AMD的M1250 GPU與英偉達(dá)的A100 GPU進(jìn)行了對比測試。這兩款設(shè)備都比各自開發(fā)的頂級芯片落后一代,它們被用來訓(xùn)練大型語言模型,研究人員發(fā)現(xiàn),AMD和英偉達(dá)的芯片在訓(xùn)練模型時都能“開箱即用”,AMD M1250 GPU的性能約為英偉達(dá)A100 GPU的80%。

MosaicML訓(xùn)練了10億到130億個參數(shù)的模型,類似于企業(yè)中用于為大型公司數(shù)據(jù)集的搜索和匯總提供AI驅(qū)動工具的模型。他們在4個GPU的單個節(jié)點上進(jìn)行訓(xùn)練,發(fā)現(xiàn)MI250 GPU的吞吐量在A100 GPU的80%以內(nèi)。MI250在每秒浮點運算和內(nèi)存方面略有優(yōu)勢,允許每個GPU訓(xùn)練更大的模型。

該公司計劃在更大的GPU集群上對更大的模型進(jìn)行分析,以確認(rèn)AMD系統(tǒng)是否可以在大規(guī)模下運行,并正在與超大規(guī)模廠商合作。他們還計劃創(chuàng)建推理基準(zhǔn),并在兩個系統(tǒng)上使用擴散模型等其他模型來測試更廣泛的選項。

雖然這兩款芯片并不是這兩家公司的頂級產(chǎn)品,但它們都被廣泛用于數(shù)據(jù)中心和訓(xùn)練AI模型。MosaicML表示,新的機器學(xué)習(xí)訓(xùn)練硬件對于在英偉達(dá)GPU供應(yīng)緊張的情況下提高計算可用性是必要的。

軟件驅(qū)動的AMD

MosaicML表示,AMD的性能與該公司去年發(fā)布的新版本軟件有關(guān),該軟件與開源AI軟件PyTorch交互。MosaicML首席技術(shù)官Hanlin Tang表示,AMD對MI250 GPU的進(jìn)一步軟件更新將使其在今年年底之前達(dá)到英偉達(dá)A100 GPU的性能。

他表示,AMD在軟件優(yōu)化方面做得特別好,盡管在硬件性能方面存在差異,但仍能跟上英偉達(dá)的發(fā)展步伐。Tang表示,用戶并不需要更改代碼庫或重新編寫大型語言模型,就可以切換到采用AMD的產(chǎn)品。他表示,它們本質(zhì)上是可以互換的。

Tang表示,AMD并沒有委托MosaicML進(jìn)行這項研究。MosaicML開發(fā)的軟件旨在使企業(yè)更容易創(chuàng)建AI模型并在內(nèi)部進(jìn)行培訓(xùn),而不是依賴OpenAI或其他大型AI實驗室的工具。他指出,這項研究是為了表明除了英偉達(dá)的芯片之外還有其他選擇。

他說,“總的來說,我們對AI訓(xùn)練硬件的未來市場非常樂觀,有更多的選擇意味著更多的計算供應(yīng),更低的市場價格,最終為想要訓(xùn)練自己的模型的用戶降低成本?!?/p>

Databricks透露,該公司近日已經(jīng)斥資13億美元收購MosaicML,這是該公司構(gòu)建企業(yè)級開源AI模型生態(tài)系統(tǒng)的更廣泛努力的一部分。這兩家公司都在開發(fā)軟件工具,使AI算法更小、更便宜地在大型數(shù)據(jù)集上運行,但MosaicML軟件將用于增強Databricks的服務(wù)。

在這份報告發(fā)布之際,英特爾日前宣布了從2025年開始在AI芯片領(lǐng)域展開競爭的長期計劃。該公司正在轉(zhuǎn)變戰(zhàn)略,專注于制造與英偉達(dá)和AMD的硬件相抗衡的產(chǎn)品。

英特爾在上周宣布其FalconShores芯片將擁有288GB內(nèi)存,并支持8位浮點計算,這對于訓(xùn)練AI模型非常重要。英特爾還聲稱,其Ponte Vecchio AI芯片的性能優(yōu)于英偉達(dá)H100。雖然Vecchio AI芯片的供應(yīng)面臨延期,但將成為美國阿貢國家實驗室最新超級計算機的核心,預(yù)計今年將完成發(fā)貨。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-07-05
AMD全面發(fā)力AI芯片挑戰(zhàn)英偉達(dá),差距還有多大?
AMD制造的AI芯片“幾乎”與業(yè)界領(lǐng)先的英偉達(dá)AI芯片一樣快。這是根據(jù)Databricks旗下的AI軟件開發(fā)商MosaicML的一項研究得出的結(jié)論。

長按掃碼 閱讀全文