2024 年 Nvidia GTC 大會(huì)涵蓋了圍繞 AI 時(shí)代的主題,這引出了以下總體問(wèn)題:各行業(yè)組織的云和 IT 基礎(chǔ)設(shè)施是否已為 AI 的未來(lái)做好準(zhǔn)備?
在主題演講中,Nvidia 首席執(zhí)行官黃仁勛在加州圣何塞 SAP 中心向觀眾發(fā)表了兩個(gè)小時(shí)的演講。演講的亮點(diǎn)是新的Blackwell GPU 平臺(tái),該平臺(tái)旨在在萬(wàn)億參數(shù)大語(yǔ)言模型上運(yùn)行實(shí)時(shí)生成 AI。每個(gè) Blackwell 芯片提供 2080 億個(gè)晶體管,最新版本的 NVLink 提供 1.8TBps 的雙向吞吐量。
這一最新聲明激發(fā)了人們對(duì)人工智能潛力的日益興奮。根據(jù)TechTarget 的企業(yè)戰(zhàn)略集團(tuán)研究,54% 的組織將在未來(lái)一年內(nèi)擁有或預(yù)計(jì)將擁有生成式人工智能。
然而,盡管有這么多令人興奮的事情,Nvidia GTC 上展示的技術(shù)規(guī)模也應(yīng)該讓任何企業(yè)決策者三思而行。在做出任何決定之前,先問(wèn)問(wèn)自己:是否需要這種級(jí)別的技術(shù)?能負(fù)擔(dān)得起嗎?如何根據(jù)自己的組織和用例調(diào)整我 AI 基礎(chǔ)設(shè)施投資規(guī)模?
盡管 GPU 技術(shù)有時(shí)會(huì)供不應(yīng)求,但可用的基礎(chǔ)設(shè)施選項(xiàng)卻并不短缺。三大公共云提供商 AWS、Google Cloud Platform 和 Microsoft Azure 在 Nvidia GTC 期間宣布計(jì)劃利用新的 Blackwell 技術(shù)。
這些公共云服務(wù)為組織提供了利用最新 GPU 技術(shù)的選擇,而無(wú)需在本地采購(gòu)和部署基礎(chǔ)設(shè)施。雖然預(yù)計(jì)云應(yīng)用將大量采用,但 AI 和生成式 AI 工作負(fù)載正在推動(dòng)本地基礎(chǔ)設(shè)施的復(fù)興。
根據(jù)研究,78% 的企業(yè)表示他們更愿意將高價(jià)值的專有數(shù)據(jù)保存在自己的數(shù)據(jù)中心。人工智能計(jì)劃的成功取決于數(shù)據(jù),企業(yè)希望將人工智能工作負(fù)載部署到更靠近數(shù)據(jù)所在位置,以降低成本并加快價(jià)值實(shí)現(xiàn)時(shí)間。
因此,基礎(chǔ)設(shè)施提供商正在積極致力于通過(guò)提供將其技術(shù)與 Nvidia 的技術(shù)相結(jié)合的集成和經(jīng)過(guò)驗(yàn)證的基礎(chǔ)設(shè)施產(chǎn)品來(lái)加快 AI 計(jì)劃的價(jià)值實(shí)現(xiàn)時(shí)間。
在展廳里,大家看到了戴爾科技、DataDirect Networks、日立 Vantara、Hammerspace、Liqid、Pure Storage、Vast Data 和 Weka 的產(chǎn)品。每款產(chǎn)品都旨在簡(jiǎn)化 Nvidia 技術(shù)的部署和集成,同時(shí)加快 AI 計(jì)劃的價(jià)值實(shí)現(xiàn)時(shí)間。盡管目的相似,但這些產(chǎn)品針對(duì)的是成本最小。雖然檢索增強(qiáng)生成等技術(shù)可以降低現(xiàn)有模型出現(xiàn)幻覺(jué)的可能性,但之前的不良體驗(yàn)可能會(huì)阻礙內(nèi)部用戶對(duì) AI 項(xiàng)目的熱情。
用例識(shí)別至關(guān)重要,因?yàn)榛A(chǔ)設(shè)施需求可能會(huì)因所用數(shù)據(jù)的規(guī)模、用于訓(xùn)練模型的參數(shù)數(shù)量以及你計(jì)劃開發(fā)自己的模型還是使用自己的數(shù)據(jù)增強(qiáng)現(xiàn)有模型而有很大差異。使用現(xiàn)成模型的檢索增強(qiáng)生成也可以使基礎(chǔ)設(shè)施投資比人們預(yù)期的要輕得多。
在確定用例時(shí),組織可以利用不斷壯大的服務(wù)合作伙伴生態(tài)系統(tǒng)來(lái)確定正確的策略。此外,戴爾科技等基礎(chǔ)設(shè)施提供商正在通過(guò)補(bǔ)充咨詢服務(wù)組合來(lái)增強(qiáng)其基礎(chǔ)設(shè)施選項(xiàng),以幫助組織識(shí)別和定義用途,以及準(zhǔn)備其數(shù)據(jù)以用于 AI 計(jì)劃。
人工智能和生成式人工智能有望改變整個(gè)商業(yè)格局。鑒于最新 Nvidia 技術(shù)的強(qiáng)大功能,很容易讓人不知所措。但不要驚慌,人工智能計(jì)劃通??梢詮暮侠淼幕A(chǔ)設(shè)施投資開始。重要的是確定正確的用途和數(shù)據(jù)集,并在流程早期利用合作伙伴。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 國(guó)家發(fā)改委成立低空經(jīng)濟(jì)發(fā)展司
- 什么是人工智能網(wǎng)絡(luò)? | 智能百科
- 工信部:2025年推進(jìn)工業(yè)5G獨(dú)立專網(wǎng)建設(shè)
- 人工智能如何改變?nèi)蛑悄苁謾C(jī)市場(chǎng)
- 企業(yè)網(wǎng)絡(luò)安全挑戰(zhàn)頻出?Fortinet 給出破解之法
- 2025年生成式人工智能將如何影響眾行業(yè)
- 報(bào)告:人工智能推動(dòng)數(shù)據(jù)中心系統(tǒng)支出激增25%
- 千家早報(bào)|馬斯克預(yù)測(cè):人工智能或?qū)⒊絾蝹€(gè)人類;鴻蒙生態(tài)(武漢)創(chuàng)新中心啟用,推動(dòng)鴻蒙軟硬件在武漢首試首用——2024年12月27日
- 中移建設(shè)被拉入軍采“黑名單”
- 大理移動(dòng)因違規(guī)套現(xiàn)等問(wèn)題,擬被列入軍采失信名單
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。