華為云徐強:四大創(chuàng)新能力 可信數(shù)智空間讓數(shù)據(jù)對AI可見、可信、可用

4月8日,由貴州省大數(shù)據(jù)發(fā)展管理局、貴陽市人民政府指導,華為技術(shù)有限公司主辦的“乘數(shù)黔行 智華未來”可信AI數(shù)據(jù)空間價值共創(chuàng)(貴州)高峰論壇在貴陽舉行。華為混合云副總裁、產(chǎn)品管理部部長徐強受邀出席,發(fā)表題為《數(shù)以智用,合以致遠,數(shù)據(jù)空間信賴之選》的主題演講。會上,徐強發(fā)布以華為云Stack為核心的可信數(shù)智空間解決方案,并系統(tǒng)性闡述了該方案如何通過“供得出、流得動、用得好、保安全”四大關鍵特性,助力數(shù)據(jù)要素價值釋放,賦能數(shù)據(jù)對AI可見、可信與可用。

華為云徐強:四大創(chuàng)新能力 可信數(shù)智空間讓數(shù)據(jù)對AI可見、可信、可用

華為混合云副總裁、產(chǎn)品管理部部長徐強

可信數(shù)據(jù)空間與大模型協(xié)同,成數(shù)智進化的關鍵

每個時代躍遷都離不開生產(chǎn)要素的轉(zhuǎn)變,數(shù)智化時代的核心生產(chǎn)要素就是數(shù)據(jù)。當前,數(shù)據(jù)要素已上升為國家戰(zhàn)略。近幾年,國家通過法規(guī)政策保駕護航、頂層設計指導方向、牽引各行業(yè)開展場景創(chuàng)新和技術(shù)創(chuàng)新,持續(xù)推動數(shù)據(jù)要素產(chǎn)業(yè)蓬勃發(fā)展。2024年11月23日,國家數(shù)據(jù)局發(fā)布《可信數(shù)據(jù)空間發(fā)展行動計劃(2024—2028年)》,這是國家層面首次針對可信數(shù)據(jù)空間這一新型數(shù)據(jù)基礎設施進行前瞻性的系統(tǒng)布局。

華為一直在數(shù)據(jù)空間領域積極探索,華為是首家加入國際數(shù)據(jù)空間協(xié)會的中國企業(yè),并與產(chǎn)業(yè)機構(gòu)密切協(xié)作,參與《可信數(shù)據(jù)空間發(fā)展行動計劃(2024—2028年)》等文件的起草,加速形成可信數(shù)據(jù)空間頂設和實施方案;并緊密配合各地試點部署,比如與上海數(shù)據(jù)集團率先提出城市數(shù)據(jù)空間新范式,為數(shù)據(jù)要素產(chǎn)業(yè)貢獻創(chuàng)新樣板。

當前,大模型技術(shù)的爆發(fā)進一步加速了數(shù)據(jù)與AI的融合需求。高質(zhì)量數(shù)據(jù)作為人工智能應用創(chuàng)新的“新燃料”,在數(shù)據(jù)與智能驅(qū)動的新范式變革加速演進中愈發(fā)凸顯基礎性和戰(zhàn)略性。近期國家數(shù)據(jù)局明確指出2025年為數(shù)據(jù)工作的改革攻堅年,將積極推動高質(zhì)量數(shù)據(jù)集的建設,持續(xù)增加數(shù)據(jù)供給,推動“人工智能+”行動賦能千行百業(yè)。

面向數(shù)據(jù)與AI產(chǎn)業(yè)協(xié)同發(fā)展新周期,徐強強調(diào),探索可信數(shù)據(jù)空間與AI大模型融合創(chuàng)新,需要通過可信AI數(shù)據(jù)空間來實現(xiàn)“泛在入湖、數(shù)據(jù)可信、AI可用”,提升AI數(shù)據(jù)集高質(zhì)量供給,深化大模型應用。

四大創(chuàng)新能力讓數(shù)據(jù)對AI可見、可信、可用

面向數(shù)據(jù)與AI產(chǎn)業(yè)協(xié)同發(fā)展新周期,華為云發(fā)布以華為云Stack為核心的可信數(shù)智空間解決方案,圍繞數(shù)據(jù)要素共享流通、大模型高質(zhì)量供數(shù)等重點場景,通過打造數(shù)據(jù)治理與語料供給、智能數(shù)據(jù)洞察與檢索等系列工程化能力,攻關區(qū)塊鏈、隱私計算、交換數(shù)據(jù)空間等核心流通技術(shù),并和生態(tài)伙伴構(gòu)建融合集成平臺,支撐建設城市、行業(yè)、AI數(shù)據(jù)空間。該方案具備“供得出、流得動、用得好、保安全”四大關鍵特性,是數(shù)據(jù)空間信賴之選。

在“供得出”方面,徐強表示,高質(zhì)量語料是AI大模型訓練和優(yōu)化的基礎,直接關系到模型的應用效果,而好的語料則應具備高質(zhì)量、多樣性和鮮活度三個核心特征。華為云Stack通過“工程化語料清洗、智能化語料標注、一體化數(shù)據(jù)供給”三項關鍵技術(shù),實現(xiàn)高質(zhì)量語料高效供給。其中,工程化語料清洗,預置80+種清洗算子,通過高性能資源調(diào)度實現(xiàn)百萬級數(shù)據(jù)一周交付;智能化語料標注包含NLP、CV、多模態(tài)、3D全場景的數(shù)據(jù)智能標注,為AI大模型提供了高質(zhì)量的訓練語料;而一體化數(shù)據(jù)供給則是面向中心訓推及訓練、邊緣推理等場景,提供超100個數(shù)據(jù)處理函數(shù),支撐數(shù)據(jù)特征加工,實現(xiàn)一站式數(shù)據(jù)高效供給。

在“流得動”方面,華為云Stack針對數(shù)據(jù)要素流通中的流通不可控、傳輸不安全以及計算不實時三大挑戰(zhàn),利用“數(shù)據(jù)空間架構(gòu)、數(shù)據(jù)膠囊技術(shù)、機密計算技術(shù)”三大創(chuàng)新能力,保障數(shù)據(jù)價值流通。方案遵循國際數(shù)據(jù)空間標準架構(gòu),提供靈活數(shù)據(jù)流通控制策略,讓數(shù)據(jù)流動全程可控。同時結(jié)合區(qū)塊鏈、隱私計算、身份認證等技術(shù),打造統(tǒng)一的控制中心、認證中心和存證中心。機密計算技術(shù)則基于鯤鵬可信執(zhí)行環(huán)境,采用硬件級隔離,全棧自主可信執(zhí)行環(huán)境結(jié)合隱私計算軟硬件協(xié)同,實現(xiàn)隱私計算性能10倍提升,秒級響應。

針對“用得好”,華為云Stack提供“數(shù)據(jù)模型化、數(shù)據(jù)智能化、數(shù)據(jù)向量化”三類AI技術(shù)加速數(shù)據(jù)價值變現(xiàn),賦能業(yè)務向智能化創(chuàng)新演進。其中,通過ModelArts Studio二次訓練和微調(diào)能力,將基礎模型數(shù)據(jù)與行業(yè)語料數(shù)據(jù)轉(zhuǎn)化成更符合行業(yè)業(yè)務特征的場景模型,能實現(xiàn)業(yè)務效率大幅提升;同時,DataArts Insight基于NLP大模型技術(shù)的自然語義理解,能夠?qū)崿F(xiàn)一句話SQL生成,數(shù)據(jù)分析師時間成本可以降低50%以上;華為云Stack提供的企業(yè)智慧搜索服務,能實現(xiàn)企業(yè)傳統(tǒng)知識庫與大模型語義搜索功能的結(jié)合,企業(yè)知識庫智能問答準確率可達90%以上。

在“保安全”部分,華為云Stack在環(huán)境安全,數(shù)據(jù)安全,模型安全,內(nèi)容安全和安全運營上提供全鏈路的安全防護能力。比如在數(shù)據(jù)安全上,支持密鑰管理、安全審計等服務實現(xiàn)數(shù)據(jù)防泄露、防污染;在模型安全方面,采用端到端模型加密,確保資產(chǎn)不泄露;從預訓練到強化學習全面安全增強,對齊人類社會價值觀;并提供對抗攻擊、海綿攻擊等多種演練與評測方案。華為云在信通院大模型可信評測中,取得業(yè)界獨家的卓越級5級。

攜手政企開展數(shù)據(jù)空間探索

徐強進一步介紹,自2023年開始,華為云持續(xù)進行數(shù)據(jù)要素解決方案關鍵技術(shù)的探索與實踐,為政企客戶提供數(shù)據(jù)要素價值釋放的信賴之選。目前,華為云攜手上海、南京等多地開展數(shù)據(jù)要素產(chǎn)業(yè)在城市數(shù)據(jù)空間的落地實施。

在上海,華為云與數(shù)據(jù)集團共建“天機·智信”平臺,通過有效整合公共數(shù)據(jù)、行業(yè)數(shù)據(jù)、企業(yè)數(shù)據(jù),賦能普惠金融、跨境貿(mào)易、健康醫(yī)療等領域;在南京,華為云攜手客戶依托政務云構(gòu)建統(tǒng)一的數(shù)據(jù)流通底座,推動城市經(jīng)濟高質(zhì)量發(fā)展。

徐強最后表示,2025年,華為云Stack將圍繞多主體身份互信、高質(zhì)量語料集開發(fā)利用、模型合規(guī)訓練推理等關鍵問題,通過構(gòu)筑“數(shù)模協(xié)同、價值共創(chuàng)”新體系,引領“一湖一鏈三引擎”新架構(gòu),突破“數(shù)字護照、機密沙箱”等新技術(shù),實現(xiàn)數(shù)據(jù)要素轉(zhuǎn)化為大模型生產(chǎn)力的價值閉環(huán)。

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )