2023中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會今天上午在貴陽市開幕。本屆數(shù)博會以“數(shù)實相融 算啟未來”為年度主題開展峰會、展覽、大賽等活動。5月25日,由上海張江集團、貴州貴安發(fā)展集團聯(lián)合承辦的人工智能大模型高端對話在貴陽國際生態(tài)會議中心舉辦,貴陽市市長馬寧宇出席會議并致辭,中國工程院院士、清華大學(xué)計算機系教授鄭緯民等專家在會上作主旨演講。優(yōu)刻得公司受邀參會,與其他來自芯片、服務(wù)器、數(shù)據(jù)中心、行業(yè)協(xié)會等領(lǐng)域的嘉賓,圍繞“數(shù)實相融,創(chuàng)新智算”主題開展圓桌對話,共同探討數(shù)據(jù)、算力與AI大模型的技術(shù)和產(chǎn)業(yè)趨勢。
大模型引領(lǐng)了AI落地和應(yīng)用的新篇章,云計算為大模型的快速發(fā)展提供所需的智算基礎(chǔ)設(shè)施支撐。UCloud優(yōu)刻得副總裁劉杰認(rèn)為,國內(nèi)大模型的發(fā)展存在算力、數(shù)據(jù)、算法和工程四個方面的挑戰(zhàn)。
在算力層面,訓(xùn)練大模型需要龐大的計算集群和高性能的硬件設(shè)備。隨著模型規(guī)模的增加,所需的算力也會相應(yīng)增加。目前國內(nèi)大模型因為禁售等原因面臨高端算力芯片供給不足,同時國產(chǎn)算力芯片形成規(guī)?;瘧?yīng)用能力還需要一定時間。
在數(shù)據(jù)層面,大模型需要大規(guī)模的數(shù)據(jù)集進行訓(xùn)練,數(shù)據(jù)的多樣性和廣覆蓋,對于模型的性能至關(guān)重要。目前,國內(nèi)基于中文語義的大模型訓(xùn)練所需要的中文數(shù)據(jù)總量不夠,且質(zhì)量不高,同時數(shù)據(jù)流通還面臨信息安全等問題。
在算法層面,大模型的訓(xùn)練涉及上千億參數(shù),需要高效的算法來加速和優(yōu)化模型性能。千億模型的混合精度訓(xùn)練性能不穩(wěn)定且調(diào)試?yán)щy,而傳統(tǒng)的機器學(xué)習(xí)算法和模型結(jié)構(gòu),難以有效地擴展到大模型訓(xùn)練。
在工程層面,大模型訓(xùn)練需要數(shù)千張甚至上萬張卡同時進行計算,涉及到基礎(chǔ)設(shè)施的性能、網(wǎng)絡(luò)架構(gòu)的設(shè)計等,以確保高性能、可擴展性和可靠性,工程化的實踐非常難。
當(dāng)前,UCloud正通過全棧云計算技術(shù)能力和工程實踐能力,為AI大模型提供安全可靠的智算基礎(chǔ)設(shè)施服務(wù)。
在算力方面,基于“東數(shù)西算”兩大自建數(shù)據(jù)中心——內(nèi)蒙古烏蘭察布數(shù)據(jù)中心和上海青浦?jǐn)?shù)據(jù)中心,UCloud為大模型訓(xùn)練和應(yīng)用提供低成本、高附加值的算力服務(wù)。UCloud自建數(shù)據(jù)中心內(nèi)部署了GPU高性能計算產(chǎn)品,上線了NVIDIA的V100S等多款顯卡,,A800也即將上線,滿足大模型用戶在多場景下的GPU加速需求。值得一提的是,位于西部的烏蘭察布數(shù)據(jù)中心電力價格相對較低,可為大模型訓(xùn)練降低30%-50%的運營成本。
面對大模型落地的私有化場景,UCloud還推出了全棧私有云解決方案,基于 UCloudStack 私有云、UCloudStor 分布式存儲及 USDP 智能大數(shù)據(jù)平臺等,構(gòu)建安全穩(wěn)定的私有化大模型基礎(chǔ)設(shè)施。
在數(shù)據(jù)方面,為降低數(shù)據(jù)存儲成本,UCloud在數(shù)據(jù)中心內(nèi)部署了新一代歸檔存儲產(chǎn)品US3,相較標(biāo)準(zhǔn)存儲降低80%存儲成本,為大模型訓(xùn)練需要的海量語料數(shù)據(jù)存儲和備份,提供更具性價比的解決方案。在數(shù)據(jù)流通環(huán)節(jié),UCloud數(shù)據(jù)安全流通平臺安全屋,將數(shù)據(jù)所有權(quán)和使用權(quán)分離,采用可信數(shù)據(jù)沙箱、安全多方計算、聯(lián)邦學(xué)習(xí)等多種技術(shù),保障數(shù)據(jù)可用不可見,可用不可拿,促進數(shù)據(jù)要素的流通,讓更多專業(yè)性、稀有性、獨特性數(shù)據(jù)釋放價值。
在工程方面,作為一家創(chuàng)業(yè)型的云計算公司,UCloud擁有從數(shù)據(jù)中心、服務(wù)器、到計算、存儲網(wǎng)絡(luò)、安全、架構(gòu)設(shè)計等全方面的資源積累和技術(shù)積累,可以為大模型行業(yè)快速構(gòu)建穩(wěn)定可靠的基礎(chǔ)設(shè)施。
隨著AI行業(yè)發(fā)展,MaaS模式將成為AI應(yīng)用的全新形式且快速發(fā)展,重構(gòu)AI產(chǎn)業(yè)的商業(yè)化結(jié)構(gòu)生態(tài),激發(fā)新的產(chǎn)業(yè)鏈分工和商業(yè)模式。當(dāng)前,UCloud也在探索與達觀數(shù)據(jù)、云知聲等擁有數(shù)據(jù)和大模型的公司合作,以“大模型+大算力”的方式,為產(chǎn)業(yè)客戶提供MaaS服務(wù),降低AI應(yīng)用開發(fā)門檻,促進大模型在產(chǎn)業(yè)場景中的落地。
與會嘉賓還探討了“東數(shù)西算”與大模型訓(xùn)練的關(guān)系。劉杰表示,大模型的“東數(shù)西訓(xùn)”,正是國家“東數(shù)西算”戰(zhàn)略的一部分。大模型訓(xùn)練和推理對算力需求是不一樣的,訓(xùn)練用算力對訓(xùn)練集群外部的延時不敏,完全可以放在西部地區(qū)的數(shù)據(jù)中心進行。
劉杰表示,包括貴安、烏蘭察布在內(nèi)的西部數(shù)據(jù)中心,承載大模型訓(xùn)練具有以下優(yōu)勢:一是西部地區(qū)有可靠的數(shù)據(jù)中心環(huán)境,為大模型訓(xùn)練提供一個穩(wěn)定的基礎(chǔ)設(shè)施保障;二是訓(xùn)練成本低,西部地區(qū)電力資源豐富,電價比較低;三是西部地區(qū)有大量的可再生能源、清潔能源,為大模型需要的算力提供綠色能源支持。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )