極客網·人工智能11月16日 微軟日前在西雅圖舉辦的Ignite大會上發(fā)布了兩款AI芯片。第一款是Maia 100 AI芯片,可以與英偉達備受追捧的AI GPU進行競爭;第二款是Cobalt 100 Arm芯片,用于一般計算任務,將與英特爾處理器進行競爭。
微軟副總裁Rani Borkar在接受媒體采訪時表示,運行在Cobalt芯片上的虛擬機實例將于2024年通過微軟的Azure云平臺實現商業(yè)化運營,但她沒有提供發(fā)布Maia 100的時間表。
如今,資金充裕的科技公司開始為客戶提供更多的云計算選擇,這些用戶使用云計算基礎設施來運行應用。多年來,阿里巴巴、亞馬遜和谷歌一直在這樣做。據估計,截至10月底,微軟擁有約1440億美元現金,在2022年占據了全球云市場21.5%的份額,僅次于亞馬遜。
谷歌在2016年發(fā)布了其用于AI的TPU。而AWS在2018年發(fā)布了基于Graviton Arm的芯片和Inferentia AI芯片,并在2020年宣布了用于訓練模型的Trainium芯片。
當GPU短缺時,云計算提供商提供的定制AI芯片可能有助于滿足需求。但與英偉達或AMD不同,微軟及其云計算供應商并不打算讓用戶購買包含其芯片的服務器。
Borkar解釋說,微軟根據客戶反饋制造了用于AI計算的芯片。微軟正在測試Maia 100如何滿足其必應搜索引擎的AI聊天機器人(現在稱為Copilot,而不是Bing Chat)、GitHub Copilot編碼助手和GPT-3.5-Turbo的需求,后者是微軟支持的OpenAI的一個大型語言模型。
GPT-3.5-Turbo模型適用于OpenAI的ChatGPT助手,該助手在去年推出后不久就廣受歡迎。OpenAI隨后迅速采取行動,在軟件中添加類似的聊天功能,因此增加了對GPU的需求。
今年9月,英偉達CFO Colette Kress在紐約舉行的Evercore會議上表示:“我們一直在與不同的供應商進行全面合作,以幫助改善我們的供應狀況,并支持許多客戶和以及滿足他們的需求?!?/p>
OpenAI之前在Azure中使用Nvidia GPU訓練模型。
除了設計Maia芯片外,微軟還設計了一款名為Sidekicks的定制液冷硬件,可以安裝在Maia服務器旁邊的機架上。微軟一位發(fā)言人表示,客戶可以在機架上安裝Sidekick,而無需對機房進行改造。
如果根據亞馬遜的經驗,微軟對Cobalt處理器的采用速度可能會快于Maia AI芯片。微軟正在Cobalt上測試Teams應用程序和Azure SQL數據庫服務。微軟表示,到目前為止,它們的性能比Azure現有的Arm芯片(由初創(chuàng)公司Ampere開發(fā))高出40%。
在過去的一年,隨著價格和利率的上升,許多企業(yè)都在尋求提高云計算支出效率的方法, AWS的客戶Graviton就是其中之一。AWS副總裁Dave Brown表示,AWS排名前100位的客戶現在都在使用基于Arm的芯片,這種芯片的性價比可以提高40%。
不過,從GPU轉移到AWS Trainium AI芯片可能比從Intel Xeons轉移到Gravitons更復雜。每個AI模型都有自己的問題。Brown表示,由于Arm在移動設備中的普及,許多人都在努力讓各種工具在Arm上工作,而在AI的芯片上,情況就不太一樣了。但他表示,隨著時間的推移,很多企業(yè)會看到,Trainium的性價比與GPU相比也會有類似的提升。
微軟副總裁Rani Borkar說:“我們已經與生態(tài)系統(tǒng)中的許多合作伙伴分享了這些規(guī)范,這將使我們所有的Azure客戶受益?!钡]有詳細說明Maia與英偉達H100等替代產品的性能。
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )