天翼云,AI取經(jīng)路上的逐夢人

最近,國產(chǎn)第一部3A游戲大作《黑神話:悟空》問世,引發(fā)了全網(wǎng)熱潮。游戲中的主角,重走西游之路,克服重重難關(guān),向世界展現(xiàn)了中國文化的絕美與中國科技的自信。

而在現(xiàn)實當中,通往產(chǎn)業(yè)智能化的AI之路,同樣可以說是一條取經(jīng)之路。廣大行業(yè)大模型開發(fā)者,也像“取經(jīng)人”一樣需要跨越重重難關(guān),克服九九八十一難。那么,誰能來幫助他們攻克艱險,踏上靈山?

9月4日,天翼云在線上舉辦了息壤一體化智算服務(wù)平臺大模型訓(xùn)推服務(wù)能力升級發(fā)布會。面向行業(yè)大模型的真實開發(fā)需求與應(yīng)用場景,天翼云將2023年推出的智算服務(wù)平臺進行了升級與革新,從而能夠為大模型開發(fā)訓(xùn)練、行業(yè)模型微調(diào)提供全生命周期的工具鏈。

經(jīng)過一年的精進,天翼云智算服務(wù)平臺具有全流程覆蓋、全方位支持、適配國內(nèi)行業(yè)大模型AI開發(fā)需求的特性。旨在簡化大模型從訓(xùn)練到部署整個流程的息壤一體化智算服務(wù)平臺,已經(jīng)可以在AI取經(jīng)之路上,助力每一位行業(yè)大模型開發(fā)者“取經(jīng)人”。

作為云服務(wù)國家隊,天翼云所打造的息壤一體化智算服務(wù)平臺訓(xùn)推服務(wù)能力的躍遷,正在幫助中國AI開發(fā)者踏上智能化之路,盎然西行,直面天命。

就像西天取經(jīng)之路一樣,大模型開發(fā)者與千行百業(yè)的AI進階之路,需要面臨重重艱險。從AI大模型訓(xùn)練所需的數(shù)據(jù)準備,到模型訓(xùn)練、推理部署,每一個環(huán)節(jié)對于行業(yè)大模型開發(fā)者來說都蘊藏著不小的挑戰(zhàn)。我們可以揀選具有代表性的幾個“AI取經(jīng)難關(guān)”進行討論:

1.數(shù)據(jù)的黑風山。

AI大模型訓(xùn)練需要大量高質(zhì)量數(shù)據(jù),但對于行業(yè)大模型開發(fā)者來說,AI所需的優(yōu)質(zhì)數(shù)據(jù)獲取難度其實是非常大的。在各行各業(yè)中,數(shù)據(jù)資源呈現(xiàn)出極其有限,且分布非常分散的特點。在收集到一定的數(shù)據(jù)之后,開發(fā)者還需要面對數(shù)據(jù)標注、數(shù)據(jù)清洗等一系列工作,開發(fā)成本極大。除此之外,行業(yè)大模型開發(fā)者還需要與行業(yè)內(nèi)的專家緊密配合,從而將專業(yè)知識與AI算法進行緊密結(jié)合。這些行業(yè)數(shù)據(jù)相關(guān)的難題,構(gòu)成了一座重重險阻的“黑風山”,成為阻擋開發(fā)者踏上AI取經(jīng)路的第一道難關(guān)。

2.訓(xùn)練的獅駝嶺。

在化解數(shù)據(jù)難題之后,開發(fā)者還需要面對AI大模型訓(xùn)練這個關(guān)鍵環(huán)節(jié),而這個環(huán)節(jié)也是綜合成本開銷最大,且不確定性最高的一個。

對于行業(yè)大模型開發(fā)者來說,大模型訓(xùn)練面臨著AI算力稀缺的核心問題,而在極高的AI算力成本之下,還需要應(yīng)對傳統(tǒng)算子運行效率差、訓(xùn)練集群故障多、故障定位與恢復(fù)時間漫長等重重困難。極高的訓(xùn)練難度和訓(xùn)練穩(wěn)定性,成為困擾大模型智能化發(fā)展的高山。

3.模型的通天河。

對于眾多行業(yè)領(lǐng)域來說,進行獨立的大模型研發(fā)并非唯一選擇,如果能夠基于先進、成熟的大模型再結(jié)合自身行業(yè)所需進行“定制化”開發(fā)可取得事半功倍的效果。然而在這種需求下,行業(yè)模型開發(fā)者也面臨著業(yè)界優(yōu)秀的模型與模型應(yīng)用實踐難以獲取,模型的本地化水平低等問題。模型的應(yīng)用部署,限制住了大模型在行業(yè)智能化的“最后一公里”。

能不能找到一個方法,連續(xù)攻克這重重難關(guān),給予行業(yè)大模型開發(fā)者一站式的幫助?

面對這個問題,能夠一站式全流程覆蓋的智算服務(wù)平臺成為關(guān)鍵的答案。天翼云對息壤一體化智算服務(wù)平臺訓(xùn)推服務(wù)能力的升級,就是希望瞄準真實的行業(yè)大模型開發(fā),與開發(fā)者一起踏破AI取經(jīng)的九九八十一難。

西天取經(jīng)需要一步步走,一關(guān)關(guān)過。對行業(yè)大模型開發(fā)的賦能,也需要了解每個環(huán)節(jié)行業(yè)大模型開發(fā)者真正面對的挑戰(zhàn),給出具有突破性的解決方案。

息壤一體化智算服務(wù)平臺訓(xùn)推服務(wù)能力升級的特點,就是洞察真實的行業(yè)AI大模型開發(fā)工作的訴求,針對每個環(huán)節(jié)都給出對應(yīng)的解法。我們可以將天翼云息壤一體化智算服務(wù)平臺訓(xùn)推服務(wù)能力的演進,分為多個層面進行理解??纯刺煲碓迫绾螏椭鶤I路上的“取經(jīng)人”,一步步踏碎AI難關(guān),走上陽關(guān)大道。

1.筋斗云,翻越模型天塹。

智算服務(wù)平臺對行業(yè)智能化的賦能,首先需要提供完善、優(yōu)質(zhì)的大模型。天翼云在息壤一體化智算服務(wù)平臺打造的大模型庫,擁有國內(nèi)領(lǐng)先的豐富大模型。其中包含Llama系列、Qwen系列、智譜系列、書生浦語系列等眾多主流大模型,涵蓋不同參數(shù)量級,供用戶靈活選擇。在原來29個模型的基礎(chǔ)之上,本次新增上線重量級商業(yè)閉源大語言模型Baichuan4、主流開源大語言模型書生浦語2系列的InternLM2-Chat-7B和InternLM2-Chat-20B、圖文多模態(tài)大模型Qwen-VL-Chat,以及Qwen2系列、Qwen1.5系列和Llama3系列的諸多模型。在這樣的大模型陣容下,各行業(yè)可以輕松調(diào)用到符合自身需求的大模型,快速實現(xiàn)大模型到行業(yè)場景的孵化。

2.七十二變,化身數(shù)據(jù)萬千。

在困擾行業(yè)大模型開發(fā)者的數(shù)據(jù)工作中,息壤一體化智算服務(wù)平臺內(nèi)置了專業(yè)的大模型數(shù)據(jù)集。中國電信在數(shù)據(jù)發(fā)展上開展的算數(shù)融合工程,首批推出超120萬對文本和語義識別類通用大模型訓(xùn)練所必需的問答對數(shù)據(jù),主要面向客服問答場景,解決了大量中小型企業(yè)訓(xùn)練數(shù)據(jù)不足的難題。

尤其需要注意的是,息壤一體化智算服務(wù)平臺內(nèi)置的數(shù)據(jù)集,在數(shù)據(jù)來源上經(jīng)過了嚴格的審核,可以確保數(shù)據(jù)的準確性與真實性,并且通過多維度的數(shù)據(jù)驗證,確保了數(shù)據(jù)集的完整性與一致性。行業(yè)大模型開發(fā)者可以獲得高質(zhì)量的數(shù)據(jù)支持,并且在該平臺中直接將數(shù)據(jù)應(yīng)用到訓(xùn)練、推理任務(wù)中。化身千萬的數(shù)據(jù)集,就像齊天大圣的七十二變,可以帶來堪稱神奇的大模型訓(xùn)練效果。

3.金箍棒,打出最強訓(xùn)練。

面對開發(fā)者在大模型訓(xùn)練中的系列痛點, 天翼云在北京、上海建成兩個萬卡規(guī)模的公共智算中心,并在其資源池上搭載了息壤一體化智算服務(wù)平臺,使其成為國內(nèi)首個單集群萬卡國產(chǎn)化全功能預(yù)訓(xùn)練云服務(wù)平臺,可支持目前業(yè)內(nèi)最大參數(shù)規(guī)模開源單體稠密模型Llama3 405B在內(nèi)的大模型訓(xùn)練。訓(xùn)練測試結(jié)果顯示,Llama3 405B模型集群有效計算效率MFU在國產(chǎn)化萬卡規(guī)模情況下達到43%,達到業(yè)界領(lǐng)先水平。

息壤一體化智算服務(wù)平臺具有全鏈路故障感知和恢復(fù)、全鏈路日志監(jiān)控和斷點續(xù)訓(xùn)等核心技術(shù),能夠?qū)崿F(xiàn)1分鐘檢測、5分鐘定位、1分鐘內(nèi)告警,本次平臺升級還增加了網(wǎng)絡(luò)I/O監(jiān)控,為訓(xùn)練穩(wěn)定性添加了保障。在斷點續(xù)訓(xùn)方面,在Llama2-70b模型萬卡規(guī)模測試場景下,在主機故障、NPU卡故障、進程退出故障、網(wǎng)絡(luò)超時故障四大類具體場景下斷點續(xù)訓(xùn)測試平均秒級故障檢測,分鐘級故障定位和自動化處理,分鐘級訓(xùn)練恢復(fù),其能力達到行業(yè)前沿水平。此次平臺升級還新增了對芯片故障的優(yōu)雅容錯,能夠做到無需重調(diào)度直接修復(fù)節(jié)點故障。目前,智算服務(wù)平臺已經(jīng)應(yīng)用于大量用戶的訓(xùn)推場景,如深圳市智算中心、人工智能實驗室等。

4、火眼金睛,勘破場景應(yīng)用。

面對不同行業(yè)、不同企業(yè)的多樣化大模型應(yīng)用場景,息壤一體化智算服務(wù)平臺做了深度的洞察,就像點亮了“火眼金睛”,看到不同行業(yè)與企業(yè)對大模型的真實期待。

無論是具備深厚專業(yè)背景的行業(yè)客戶,還是對大模型推訓(xùn)能力有嚴格要求的大模型廠商,都可以通過息壤一體化智算服務(wù)平臺獲得準確的支持,可通過直接調(diào)用預(yù)置的大模型服務(wù),使得開發(fā)者能夠輕松地將先進的AI技術(shù)集成到自己的業(yè)務(wù)中。

如今,AI取經(jīng)之路上行者不絕,息壤一體化智算服務(wù)平臺訓(xùn)推服務(wù)能力也為諸多“取經(jīng)人”提供了深層次的幫助。

比如說,中醫(yī)與大模型的結(jié)合,是近段時期的產(chǎn)業(yè)熱點話題。中國中醫(yī)科學院中醫(yī)藥信息研究所與天翼云合作,共同探索AI+中醫(yī)藥應(yīng)用創(chuàng)新。在中醫(yī)垂類大模型的微調(diào)、應(yīng)用發(fā)布平臺等環(huán)節(jié)中,天翼云提供的息壤一體化智算服務(wù)平臺為中醫(yī)藥信息研究所提供了多樣化的算法支持與模型優(yōu)化工具,幫助大模型能夠更好地挖掘中醫(yī)藥數(shù)據(jù)的潛在價值,實現(xiàn)中醫(yī)瑰寶與AI技術(shù)的融合發(fā)展。

這些真實的大模型落地場景,證明了息壤一體化智算服務(wù)平臺為行業(yè)智能化帶來的有力推助。作為國家云的天翼云,正在通過智算服務(wù)踏碎AI難關(guān),助力行業(yè)大模型開發(fā)順利西行。

讓每一位“AI取經(jīng)人”都找到契合的產(chǎn)業(yè)助力,離不開圍繞智算平臺的生態(tài)建設(shè)?;谄脚_能力,天翼云聯(lián)合伙伴上線了魔樂(Modelers.cn)開發(fā)者社區(qū)。

魔樂開發(fā)者社區(qū)真實貼合了中國的產(chǎn)業(yè)智能化環(huán)境,以及中國AI開發(fā)者的需求。就像《黑神話:悟空》展示的中國文化底蘊那樣,天翼云承載國家云之責,不斷加速構(gòu)建滿足AI產(chǎn)業(yè)發(fā)展所需的智算社區(qū)。具體而言,社區(qū)具有三大特色:

1.極致易用的工具鏈。

魔樂開發(fā)者社區(qū)能夠提供高易用性的API,快速實現(xiàn)開發(fā)者和研究人員的創(chuàng)意,并且支持千款大模型一鍵式離線復(fù)現(xiàn),使能開發(fā)者快速搭建開發(fā)環(huán)境,構(gòu)建AI應(yīng)用。

2.中文優(yōu)質(zhì)AI資源。

魔樂開發(fā)者社區(qū)已經(jīng)擁有超過1000個大模型,構(gòu)建了5大專區(qū),能夠為開發(fā)者提供通義千問、chatGLM、百川、書生系列、星辰Telechat等主流中文大模型資源。

3.國產(chǎn)化算力使能。

面對國產(chǎn)化AI算力需求的發(fā)展,魔樂開發(fā)者社區(qū)還構(gòu)建了體驗空間,提供限時免費的國產(chǎn)化算力資源,支持MindSpeed、Accelerator等加速庫,應(yīng)對大模型時代分布式訓(xùn)練的挑戰(zhàn),顯著提升大模型訓(xùn)練效率。

面向著數(shù)據(jù)、訓(xùn)練、推理的重重AI難關(guān),天翼云選擇步步前行,關(guān)關(guān)踏破。

經(jīng)過不斷的精進升級,天翼云智算服務(wù)平臺已經(jīng)在技術(shù)能力、資源積累、生態(tài)構(gòu)建等方面展露出了極高的產(chǎn)業(yè)化水準。伴隨各個領(lǐng)域的行業(yè)大模型開發(fā)者對智算服務(wù)平臺的深度應(yīng)用,產(chǎn)業(yè)智能化的路途正在變得愈發(fā)順遂,前途更加光明。

踏智能路,選國家云。隨著天翼云的息壤一體化智算服務(wù)平臺訓(xùn)推服務(wù)能力的不斷升級完善,會讓每一位行業(yè)大模型開發(fā)者在AI世界中,都成為自己故事中的“取經(jīng)人”。

免責聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2024-09-09
天翼云,AI取經(jīng)路上的逐夢人
天翼云,AI取經(jīng)路上的逐夢人

長按掃碼 閱讀全文