隨著全球數(shù)字經(jīng)濟(jì)的快速發(fā)展,云計(jì)算提高了人們對(duì)數(shù)據(jù)傳輸速度的期望,但人工智能(AI)工作負(fù)載給帶寬以更快、更可靠地傳輸數(shù)據(jù)帶來了更大的壓力。
雖然像Compute Express Link(CXL)這樣的協(xié)議有助于優(yōu)化數(shù)據(jù)存儲(chǔ)位置,使其更接近需要的位置,但連接對(duì)于盡可能快地移動(dòng)數(shù)據(jù)仍然至關(guān)重要。在采用率下降之后,亞馬遜和谷歌等公司在數(shù)據(jù)中心擴(kuò)展人工智能的光收發(fā)器技術(shù)有所增加,而連接性則與硬件和軟件一起融入到全棧系統(tǒng)中。
光通信市場(chǎng)研究公司LightCounting在其2023年7月的大型數(shù)據(jù)中心光學(xué)報(bào)告中表示,光收發(fā)器銷量的增加與GPU和基于GPU的AI集群系統(tǒng)銷量的大幅增長(zhǎng)相關(guān)。該公司預(yù)測(cè),未來五年用于人工智能集群應(yīng)用的以太網(wǎng)光收發(fā)器銷售額將達(dá)到176億美元,而同期以太網(wǎng)收發(fā)器的所有其他應(yīng)用合計(jì)將產(chǎn)生285億美元的銷售額。
支持人工智能集群的部署抵消了云計(jì)算公司因預(yù)計(jì)經(jīng)濟(jì)衰退尚未實(shí)現(xiàn)而削減的支出。
對(duì)人工智能連接的需求比最近炒作的ChatGTP早了幾年,谷歌在2019年至2020年期間在其人工智能集群中部署的光學(xué)器件比其數(shù)據(jù)中心基礎(chǔ)設(shè)施的其他部分還要多。據(jù)LightCounting估計(jì),到2022年,部署在AI集群中的光收發(fā)器已占整個(gè)市場(chǎng)的25%。
LightCounting首席執(zhí)行官Vlad Kozlov在接受采訪時(shí)表示,在2022年底,生產(chǎn)需求有所放緩,這意味著今年第一季度光模塊銷售將出現(xiàn)下滑。但是,到今年4月,英偉達(dá)在人工智能領(lǐng)域的業(yè)務(wù)明顯活躍起來,這也推高了LightCounting的預(yù)測(cè)?!斑@也提醒了所有正在建設(shè)人工智能基礎(chǔ)設(shè)施的競(jìng)爭(zhēng)對(duì)手?!?/p>
對(duì)人工智能更廣泛的興趣推動(dòng)了簡(jiǎn)化基礎(chǔ)設(shè)施部署的需求
Kozlov表示,英偉達(dá)在人工智能基礎(chǔ)設(shè)施市場(chǎng)的關(guān)鍵優(yōu)勢(shì)在于,它開發(fā)了包括光連接、硬件和軟件的全棧系統(tǒng)。“如果你看看谷歌和亞馬遜正在做的事情,就會(huì)發(fā)現(xiàn)他們正在內(nèi)部開發(fā)人工智能硬件和軟件?!?/p>
他說,這些公司和微軟等其他公司已經(jīng)從人工智能應(yīng)用中賺錢有一段時(shí)間了,但ChatGPT的出現(xiàn),讓人們認(rèn)為人工智能可以在不同行業(yè)更廣泛地使用,以提高工人的生產(chǎn)力。“除了非常大的公司之外,許多其他公司也開始關(guān)注人工智能。”
Kozlov表示,全棧解決方案很有吸引力,因?yàn)樵S多公司不具備構(gòu)建軟件和硬件的專業(yè)知識(shí),因此轉(zhuǎn)向Nvidia可以更輕松地開始構(gòu)建人工智能基礎(chǔ)設(shè)施。
在連接方面,光收發(fā)器的優(yōu)勢(shì)在于能夠在更長(zhǎng)的距離上支持更高的數(shù)據(jù)速率。雖然銅的彈性比預(yù)期更強(qiáng),但距離隨著數(shù)據(jù)速率的提高而縮短。“與此同時(shí),人工智能集群正在變得越來越大?!盞ozlov表示,谷歌正在討論在其陣列中擁有數(shù)萬個(gè)GPU?!爱?dāng)系統(tǒng)變得那么大時(shí),顯然距離也會(huì)變大。你需要使用更多的光學(xué)器件。”
Kozlov表示,除了能夠長(zhǎng)距離高速傳輸信號(hào)之外,光轉(zhuǎn)換的吸引力還在于它們可以更輕松地重新配置連接——當(dāng)GPU跨數(shù)據(jù)中心的不同部分時(shí),靈活性非常有用,有助于提高可擴(kuò)展性和可靠性,因?yàn)榭梢钥焖倮@過有問題的節(jié)點(diǎn)以保持模型運(yùn)行。
光收發(fā)器與協(xié)議無關(guān),這意味著它們可以很好地與以太網(wǎng)和InfiniBand配合使用。也沒有光纖連接器——全是電氣的。
Kozlov表示,一個(gè)顯著的趨勢(shì)是從光纜轉(zhuǎn)向可插拔光學(xué)器件。“它只是一個(gè)插入服務(wù)器的小型設(shè)備?!?/p>
他表示,英偉達(dá)是最新光學(xué)熱潮的推動(dòng)者之一,由于其解決方案的高連接密度,英偉達(dá)正在轉(zhuǎn)向可插拔收發(fā)器。LightCounting報(bào)告稱,英偉達(dá)2023年4月的財(cái)報(bào)電話會(huì)議暗示了人工智能基礎(chǔ)設(shè)施的總體資金規(guī)模,盡管實(shí)際數(shù)字尚不清楚。Nvidia2023年第二季度的收入預(yù)計(jì)將環(huán)比增長(zhǎng)50%,這主要是由用于AI集群的GPU和基于GPU的系統(tǒng)的銷售推動(dòng)的,這使得一些財(cái)務(wù)分析師估計(jì)未來五年用于AI的累積收發(fā)器收入將達(dá)到1000億美元或更多單獨(dú)的應(yīng)用程序。
工作負(fù)載定義數(shù)據(jù)中心設(shè)計(jì)
Nvidia網(wǎng)絡(luò)高級(jí)副總裁GiladShainer在接受媒體采訪時(shí)表示,整個(gè)數(shù)據(jù)中心的設(shè)計(jì)需要有針對(duì)性,其中包括人工智能工作負(fù)載及其所需的連接?!耙磺卸急仨氁云胶獾姆绞竭M(jìn)行?!?/p>
他說,人工智能工作負(fù)載分布在數(shù)據(jù)中心的不同連接設(shè)備之間。“定義數(shù)據(jù)中心功能的元素是網(wǎng)絡(luò)。將所有內(nèi)容連接在一起的方式?jīng)Q定了您將能夠運(yùn)行什么樣的工作負(fù)載?!?/p>
Shainer表示,一旦這些元素就位,就可以創(chuàng)建進(jìn)入數(shù)據(jù)中心的必要芯片和ASIC。
InfiniBand在Nvidia的AI數(shù)據(jù)中心解決方案中發(fā)揮著關(guān)鍵作用。該公司的Quantum InfiniBand網(wǎng)內(nèi)計(jì)算平臺(tái)專為高性能計(jì)算(HPC)、人工智能和超大規(guī)模云基礎(chǔ)設(shè)施而設(shè)計(jì)。但Nvidia也有自己的NVLink,這是一種基于有線的串行多通道近距離通信鏈路。它使用專有的高速信號(hào)互連(NVHS),與PCIExpress不同,一個(gè)設(shè)備可以由多個(gè)NVLink組成,并且設(shè)備使用網(wǎng)狀網(wǎng)絡(luò)而不是中央集線器進(jìn)行通信。
Shainer表示,NVLink的作用是共享內(nèi)存訪問,并與InfiniBand一起允許橫向擴(kuò)展整個(gè)平臺(tái)。
他補(bǔ)充說,平臺(tái)本身的目的很重要?!澳阆脒\(yùn)行什么樣的工作負(fù)載?你想解決什么樣的問題?”Shainer表示,一旦確定了數(shù)據(jù)中心的用途,就可以在其中安裝適當(dāng)?shù)木W(wǎng)絡(luò),包括InfiniBand和NVLink,以獲得必要的數(shù)據(jù)吞吐量,這是更困難的部分,同時(shí)還需要大量帶寬快點(diǎn)?!澳阈枰焖偻瓿伤脑蚴且?yàn)槟阏谔幚矸植际接?jì)算。”
Shainer表示,重要的是網(wǎng)絡(luò)在大規(guī)模滿負(fù)載下的能力,最慢的鏈路決定了系統(tǒng)的整體性能。為傳統(tǒng)云計(jì)算構(gòu)建的數(shù)據(jù)中心并非旨在提供人工智能工作負(fù)載所需的性能,這可能需要數(shù)千個(gè)GPU以極低的延遲工作?!斑@是一個(gè)非常復(fù)雜的過程,你需要同步,”他說。
施耐德電氣創(chuàng)新和數(shù)據(jù)中心副總裁SteveCarlini表示,人工智能工作負(fù)載已經(jīng)徹底改變了IT和物理基礎(chǔ)設(shè)施,而不僅僅是從網(wǎng)絡(luò)角度來看。在接受媒體采訪時(shí),他表示,近年來,各種規(guī)模的公司都在瘋狂爭(zhēng)奪建設(shè)支持人工智能的基礎(chǔ)設(shè)施?!八辉俨渴饦?biāo)準(zhǔn)套接字X86服務(wù)器?!?/p>
Carlini表示,人工智能數(shù)據(jù)中心擁有CPU、GPU、加速器和DPU,需要一個(gè)架構(gòu)來移入和移出數(shù)據(jù)?!懊總€(gè)GPU加速器都有一個(gè)網(wǎng)絡(luò)端口,并且它們都同步運(yùn)行?!?/p>
Carlini說,人工智能數(shù)據(jù)中心與傳統(tǒng)數(shù)據(jù)中心的另一個(gè)顯著區(qū)別是,它們一直在運(yùn)行工作負(fù)載,這會(huì)改變?cè)O(shè)計(jì)參數(shù)?!斑@是令人難以置信的熱量?!?/p>
Carlini表示,將10000個(gè)GPU集中在一起并將它們放入服務(wù)器機(jī)架中確實(shí)面臨物理限制,其中最重要的是熱量。除了各種冷卻選項(xiàng)之外,解決方案是將所有部件分開?!皩?shí)現(xiàn)這一目標(biāo)的障礙在于網(wǎng)絡(luò)?!彼硎荆M管光收發(fā)器成本已大幅下降并且可以覆蓋更遠(yuǎn)的距離,但運(yùn)行400gig InfiniBand并不便宜。“最大的猶豫實(shí)際上是網(wǎng)絡(luò)成本,因?yàn)槊總€(gè)GPU都有自己的網(wǎng)絡(luò)連接?!?/p>
連接速度較慢也有其用武之地
并非所有連接都需要是像InfiniBand這樣的快速光纖連接。Carlini表示,有一些基于銅纜的創(chuàng)新,例如Broadcom的Jericho3,它專為AI集群而設(shè)計(jì),運(yùn)行速度可達(dá)800GB?!斑@似乎是很多人都在等待的解決方案?!?/p>
Carlini表示,快速、可擴(kuò)展的連接以及銅纜的可靠性和低成本是圣杯,但任何數(shù)據(jù)中心都將擁有包括光纖、銅纜和無線在內(nèi)的解決方案層次結(jié)構(gòu)。
Carlini表示,將要攝取的數(shù)據(jù)可以通過銅線傳輸?shù)綌?shù)據(jù)中心,而WiFi足以滿足管理功能。他說,實(shí)時(shí)關(guān)鍵任務(wù)人工智能需要光學(xué)連接,特別是當(dāng)模型開始攝取更多視頻和圖像而不僅僅是文本時(shí)。
Lightcounting的Koslov表示,光學(xué)連接的下一個(gè)前沿是可插拔的——它將與GPU和ASIC共同封裝?!澳悴槐?fù)?dān)心插入收發(fā)器。電子芯片將會(huì)產(chǎn)生光學(xué)器件?!?/p>
他表示,光學(xué)的基本優(yōu)勢(shì)不會(huì)消失。“我們看不到任何替代方案?!?/p>
然而,Koslov表示,盡管存在局限性,但銅仍在繼續(xù)尋找改進(jìn)的方法?!肮馀c銅將共存。”
資料來源:https://www.fierceelectronics.com/electronics/ai-boosts-optical-connectivity-demand
CIBIS峰會(huì)
由千家網(wǎng)主辦的2023年第24屆CIBIS筑智能化峰會(huì)即將正式拉開帷幕,本屆峰會(huì)主題為“智慧連接,‘筑’就未來”, 將攜手全球知名智能化品牌及業(yè)內(nèi)專家,共同探討物聯(lián)網(wǎng)、AI、云計(jì)算、大數(shù)據(jù)、IoT、智慧建筑、智能家居、智慧安防等熱點(diǎn)話題與最新技術(shù)應(yīng)用,分享如何利用更知慧、更高效、更安全的智慧連接技術(shù),“筑”就未來美好智慧生活。歡迎建筑智能化行業(yè)同仁報(bào)名參會(huì),分享交流!
報(bào)名方式
成都站(10月24日):https://www.huodongxing.com/event/6715336669000
西安站(10月26日):https://www.huodongxing.com/event/3715335961700
長(zhǎng)沙站(11月09日):https://www.huodongxing.com/event/7715337579900
上海站(11月21日):https://www.huodongxing.com/event/9715337959000
北京站(12月23日):https://www.huodongxing.com/event/3715338464800
廣州站(12月07日):https://www.huodongxing.com/event/6715338767700
更多2023年CIBIS峰會(huì)信息,詳見峰會(huì)官網(wǎng):http://summit.qianjia.com/
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 國(guó)家發(fā)改委成立低空經(jīng)濟(jì)發(fā)展司
- 什么是人工智能網(wǎng)絡(luò)? | 智能百科
- 工信部:2025年推進(jìn)工業(yè)5G獨(dú)立專網(wǎng)建設(shè)
- 人工智能如何改變?nèi)蛑悄苁謾C(jī)市場(chǎng)
- 企業(yè)網(wǎng)絡(luò)安全挑戰(zhàn)頻出?Fortinet 給出破解之法
- 2025年生成式人工智能將如何影響眾行業(yè)
- 報(bào)告:人工智能推動(dòng)數(shù)據(jù)中心系統(tǒng)支出激增25%
- 千家早報(bào)|馬斯克預(yù)測(cè):人工智能或?qū)⒊絾蝹€(gè)人類;鴻蒙生態(tài)(武漢)創(chuàng)新中心啟用,推動(dòng)鴻蒙軟硬件在武漢首試首用——2024年12月27日
- 中移建設(shè)被拉入軍采“黑名單”
- 大理移動(dòng)因違規(guī)套現(xiàn)等問題,擬被列入軍采失信名單
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。