大模型向下扎根深入行業(yè),必須要破解高質量數據供給的挑戰(zhàn)。7月5日,2024年世界人工智能大會進入第二天,作為數據要素領域的主要技術服務商,螞蟻集團發(fā)布“隱語Cloud”大模型密算平臺,通過軟硬件結合的可信隱私計算技術,在大模型托管和大模型推理等環(huán)節(jié)實現數據密態(tài)流轉,保護模型資產、數據安全和用戶隱私。
當下,高質量數據供給和安全流通,成為大模型進入垂直產業(yè)應用的首要挑戰(zhàn)。其一,行業(yè)大模型要獲得解決專業(yè)問題的能力,首先要經過數量充足、質量高的專業(yè)數據訓練。然而,專業(yè)數據往往分散在不同的機構、企業(yè)中,并且由于價值大、保密要求高,難以流動。此外,在企業(yè)、大模型廠商和用戶之間存在信任壁壘,企業(yè)擔心數據對外泄露,大模型廠商擔心模型資產安全,用戶擔心個人數據和隱私風險。
在發(fā)布會現場,螞蟻密算CEO王磊介紹,“隱語Cloud”大模型密算平臺首批推出兩大服務,分別為大模型密態(tài)托管和大模型密態(tài)推理。大模型密態(tài)托管,指模型提供方可以將模型加密后托管在平臺上,一鍵完成云上密態(tài)部署,保護模型資產不被泄漏和盜用;大模型密態(tài)推理,是指數據以密態(tài)形式完成推理,保護用戶交互時的數據安全、商業(yè)機密等。
此外,該平臺支持GPU在可信執(zhí)行環(huán)境下進行計算,使得大模型推理在密態(tài)形式下的響應時間和使用效率與明文大模型接近,實現大規(guī)模商業(yè)可用。在安全保障上,該產品利用內存、磁盤加密等方法,實現用戶訪問的端到端加密和托管模型的跨域訪問控制。在易用性上,產品支持輕量化遠程認證,用戶在網頁訪問時就可以完成遠程認證,不需要額外的操作步驟。
當下,大模型在垂直行業(yè)應用時,許多企業(yè)通過私有化部署來應對數據安全挑戰(zhàn),這不僅增加企業(yè)的運維和服務成本,也影響對外服務的效率和質量。對行業(yè)的發(fā)展來說,私有化方案不利于多方數據跨領域、跨行業(yè)高效融合,無法進一步激發(fā)大模型的能力。
據介紹,隱語Cloud”大模型密算平臺提供公有云和專有云交付方案,支持市面上主流的通用大模型。以公有云為例,無論用戶重新構建新的垂直大模型,或者將已有的大模型重新部署在該平臺,只需一鍵部署和接入,比如10分鐘即可完成高可用推理服務的發(fā)布。在使用過程中,用戶按需獲取密態(tài)算力,即開即得。
王磊透露,隱語Cloud大模型密算平臺的服務,將逐步覆蓋到垂直大模型從構建到對外服務的全鏈路數據安全。“接下來,我們將為垂直大模型從預訓練、微調、評測、推理到用戶交互的全程提供密態(tài)計算服務,在大模型提供方、數據提供方、大模型使用方等之間實現數據可信安全流轉。平臺還將提供密態(tài)大模型開發(fā)所需的全鏈路工具,提供的服務包括密態(tài)檢索增強生成、密態(tài)提示詞、Agent流程編排等。”
螞蟻集團副總裁兼首席技術安全官、螞蟻密算董事長韋韜認為,數據供給決定了大模型應用能力的上限,而隱私計算技術決定了數據跨域供給的上限。當大模型從通用走向專業(yè)應用,從技術想象力走向產業(yè)的生產力,必須要解決高質量數據集稀缺與專業(yè)數據阻滯的挑戰(zhàn),否則大模型作為“智力引擎”,只會陷入空轉。今后,高價值數據要深度融合,一定需要以密態(tài)方式進行安全流轉。
韋韜表示,螞蟻集團從2016年開始探索隱私計算技術,能力涵蓋了全??尚偶夹g、多方安全計算、聯邦學習、同態(tài)加密、差分隱私、機密計算等隱私計算全譜技術域?!拔覀兿M摵袭a業(yè)合作伙伴,把螞蟻集團多年來在密態(tài)計算技術上的探索和創(chuàng)新,以開源和產品化的形式對外開放,助力推動產業(yè)向前發(fā)展,為實體經濟和中小微企業(yè)創(chuàng)造新的價值,讓數據價值的流動像自來水一樣即開即用?!?/p>
目前,螞蟻可信隱私計算的核心技術已全部開源,包括“隱語”可信隱私計算框架、“星綻”可信執(zhí)行環(huán)境操作系統Occlum等。此外,參與制定了60多項國內外隱私計算技術標準,其中主導了9項國際標準。螞蟻還與超過50所國內外高校緊密合作,并且與中國計算機學會聯合設立了“隱私計算專項科研基金”。
今年5月底,螞蟻集團對外公布了以人工智能和數據要素技術為核心的科技戰(zhàn)略,隨后成立了獨立運營的密態(tài)計算公司——浙江螞蟻密算科技有限公司,將提供密算相關的產品和服務,包括一套端到端的數據安全保障、一套軟硬件結合的計算加速解決方案和一個隱私計算云服務平臺,推動數據安全可信的跨云跨端低成本流通。
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )