你認識AI開發(fā)者嗎?
在工作中,我們會采訪形形色色的AI開發(fā)者。他們來自不同的地方,說著不同的口音。年紀小的還沒上小學,年紀大的在退休之后又找到了新的興趣與夢想。他們有人心懷溫暖,用AI技術幫助聽障人士恢復聽力;有人心系桑梓,用AI能力防沙固沙,誓要把家鄉(xiāng)的沙漠變成綠洲;有人能力卓群,一個人就是一間AI工廠,完成的AI創(chuàng)新不計其數。
如果問,這些不同行業(yè),不同學科,不同年齡的AI開發(fā)者們有什么共同之處?我能想到的似乎有兩點。
一個是他們的眼里都有光亮,愿意用創(chuàng)新的思維去看待這個世界,嘗試用想象力去發(fā)現和解決問題。
另一個是他們的手里都有共同的工具——文心加飛槳,已經成為無數AI開發(fā)者探索夢想的基石。
對于這些開發(fā)者來說,每年有兩次盛大的“節(jié)日”。那就是WAVE SUMMIT深度學習開發(fā)者大會。WAVE SUMMIT見證著飛槳和文心的成長,同時也陪伴了無數AI開發(fā)者的追夢之旅。
每年兩屆的WAVE SUMMIT,恰好在剛剛迎來了五年十屆的節(jié)點,也到了值得回顧、總結和再出發(fā)的時候。12月28日,百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰在第十屆WAVE SUMMIT深度學習開發(fā)者大會上發(fā)表了《文心加飛槳,翩然赴星河》主題演講。期間,王海峰分享了飛槳和文心的最新發(fā)展成果,公布了文心一言用戶規(guī)模已經超過一億,同時也回顧了WAVE SUMMIT一路走來的思考與感受。
五年走來,一場花開。深度學習技術在中國大地上從嫩芽變成了雨林,AI開發(fā)者手中有了堅實的技術工具,面向千行百業(yè)的AI生態(tài)已經成型,通用人工智能的曙光已經顯現。
五年時間,正好適合回顧這一切的改變是如何發(fā)生的。面向未來,文心加飛槳的組合又將帶來什么?
百度與萬千AI開發(fā)者,將繼續(xù)赴這場AI技術的星河之約。
五年十屆,共赴AI的星辰大海
過去五年,是中國深度學習技術發(fā)展速度最快,AI開發(fā)者規(guī)模增長最快的時期。五年當中,無數開發(fā)者加入AI的尋夢之旅,萬千企業(yè)開啟了智能化的征程,大量院校與科研機構開始用AI探索科學的奧秘。
回顧深度學習技術在中國的發(fā)展脈絡,會發(fā)現WAVE SUMMIT是貫穿過去五年一條非常重要的發(fā)展線索。在這個舞臺上,每次都能分享到最具深度與前瞻性的AI技術洞察,每次都能迎來巨量的深度學習開發(fā)平臺與AI大模型技術更新。
WAVE SUMMIT走過了五年十屆。在這五年時間里,我們對AI技術的認識與洞察逐步加深,年年迭代。產學各界的共識不斷凝聚,面向未來的發(fā)展路徑不斷清晰。
在2019年的首屆WAVE SUMMIT,王海峰提出“深度學習框架是智能時代的操作系統”,“深度學習推動人工智能進入工業(yè)大生產階段”。這樣的判斷為智能化帶來了新的視野,“AI工業(yè)大生產”也成為接下來AI技術發(fā)展的核心。
接下來,王海峰在2020年提出了“打造AI新型基礎設施,云智一體加速產業(yè)智能化”,AI大生產平臺升級為云智一體的新型基礎設施,為產業(yè)智能化奠定了堅實基礎;2021年,提出AI技術呈現“融合創(chuàng)新”和“降低門檻”的特點;2022年,確定了“深度學習平臺加大模型,貫通AI全產業(yè)鏈,夯實產業(yè)智能化基座”。時間來到2023年,王海峰明確提出了“大語言模型為通用人工智能帶來曙光”。
這些洞察和預判逐步推進,層層銜接,在不斷獲得產學各界認證的同時,推動接下來AI技術的持續(xù)發(fā)展。更重要的是,這些預判一次次點亮了AI開發(fā)者眼中的星光。
而文心加飛槳的體系建設,則讓AI開發(fā)者可以將星光帶入現實。WAVE SUMMIT的另一重價值,在于將百度對AI技術的預判,轉化為真實的技術突破、工具升級、生態(tài)建設,組成了蔚為大觀的深度學習基礎設施。其中,文心與飛槳已經成長為整個AI產業(yè)的兩大支柱。
目前階段,飛槳已經完成了包括核心框架、基礎模型庫、開發(fā)套件、工具組件等能力的全面建設,還有助力開發(fā)者成長的星河社區(qū)。飛槳具有動靜統一的深度學習框架、端到端自適應大規(guī)模分布式訓練、云邊端全場景高性能推理等核心領先技術。
在飛槳生態(tài)方面,2019年飛槳開發(fā)者規(guī)模為150萬。截至2023年12月底,飛槳已凝聚1070萬開發(fā)者,服務23.5萬家企事業(yè)單位,基于飛槳創(chuàng)建了86萬個模型。突破千萬的開發(fā)者,證明了AI技術迎來了發(fā)展最快,凝聚力最強的時代。
在備受關注的大模型領域,百度在2019年開始預訓練大模型研發(fā),推出了文心大模型1.0。經過多年積累,今年3月百度率先發(fā)布了知識增強大語言模型文心一言。10月,文心一言的基礎模型升級到4.0,理解、生成、邏輯和記憶四大AI基礎能力全面提升。文心大模型4.0僅僅在過去兩個月整體效果又提升了32%。
王海峰現場披露,文心一言用戶規(guī)模已突破1億。自8月31日獲準開放對公眾提供服務以來,文心一言的用戶提問量一路攀升,獲得了越來越充沛的用戶信任。一億用戶的規(guī)模證明,下一個超級流量入口儼然已經成型。
王海峰表示:“五載十屆,我們與所有開發(fā)者一起,踔厲奮發(fā),篤行不怠。愿繼續(xù)與所有開發(fā)者攜手并肩,在飛槳和文心的支持下,共赴通用人工智能的星辰大?!薄?/p>
WAVE SUMMIT走過的五年,似乎讓我們對AI技術一切認知都發(fā)生了變化。無數開發(fā)者、企業(yè)、科研工作者,以及來自千行百業(yè)的人們,共同走過了一段激動人心的AI旅程。
而更加讓人激動的旅途,永遠在未來,在更遠處。
花開大模型:文心生態(tài)進取突破
AI大模型,是2023年全球AI行業(yè),乃至整個科技行業(yè)的第一關鍵詞。AI開發(fā)者,以及更多有志于AI機遇的準開發(fā)者們,目前最關注的就是能否有效利用大模型技術,能否加入一個完善的大模型生態(tài),能否將大模型與自身所在行業(yè)、領域進行結合?
回顧這一年,伴隨著文心一言的橫空出世,文心大模型頻頻帶給我們驚喜。在本屆WAVE SUMMIT當中,百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜發(fā)布了文心一言和飛槳星河社區(qū)的最新進展與升級動作。
從產業(yè)進程中看,文心大模型已經取得了驚人的成績。從對外開放到今天,文心一言用戶已經遍布全國各地,累計完成了37億字的文本創(chuàng)作,文本創(chuàng)作量相當于十部《永樂大典》、500套《魯迅全集》、10000本《三體》。在代碼生成方面,文心一言累計輸出了三億行代碼,涵蓋所有主流編程語言。
可以看到,不同領域,不同特點的用戶需求都在文心一言當中得到了極大地滿足。在學習方面,文心一言為中小學學生提供了一系列幫助,比如提升學習能力,進行口語訓練,拓展課外知識。大學生則廣泛利用文心一言進行知識查詢,信息搜集,專業(yè)能力提升。
在專業(yè)應用方面,文心一言已經累計幫助用戶處理專業(yè)合同多達4億次,在租房合同審查等觸手可及的場景提供重要幫助。在旅行場景中,文心一言已經累計制定了五百萬次的旅行計劃。
在悲歡交集的生活中,文心一言為用戶發(fā)出了1083萬次的關懷、鼓勵,提供了240萬次的建議和支持。當然,這些努力也得到了回饋,文心一言已經收獲了超過2000萬次的贊賞和感謝。
過去一年里,文心一言的基礎模型文心大模型,發(fā)布了3.5和4.0兩個大版本。為了能夠帶給客戶更深層的幫助,文心大模型還研發(fā)了智能體技術。接下來,文心一言的智能體模式,將在專業(yè)版中開啟測試。
伴隨文心大模型的技術進步與產業(yè)發(fā)展,開發(fā)者對文心大模型的需求也愈發(fā)強烈。目前,星河社區(qū)已經有超過4000個基于文心一言開發(fā)的應用,覆蓋了各個行業(yè)與領域。面向未來,文心大模型的生態(tài)建設與開放,將成為最為重要的工作。
作為中國最大的AI開發(fā)者社區(qū),飛槳星河社區(qū)全面升級,為廣大開發(fā)者提供豐富的異構算力和通用組件,飛槳產業(yè)級模型庫和全流程開發(fā)工具鏈,實現低成本開發(fā)AI應用。在飛槳和文心大模型的共同驅動下,星河社區(qū)具備了“AI原生應用創(chuàng)新全要素”,為開發(fā)者提供開發(fā)、體驗、推廣、交流、學習一體化服務。
最新發(fā)布的大模型工具中心,集合了百度人工智能多年來的建設成果,包括飛槳產業(yè)級模型庫、百度大腦AI能力、文心一言工具等,同時支持生態(tài)工具接入,賦能開發(fā)者高效開發(fā)AI原生應用。
現場,吳甜使用大模型工具中心的“多工具智能編排”開發(fā)模式,演示了如何在零代碼情況下開發(fā)具備圖文識別、問答、翻譯、播報等多模態(tài)全功能的“旅行助手”應用。
為了讓文心大模型更聰明,更智慧,WAVE SUMMIT上還首次公布了文心導師計劃。首批有10位來自不同領域的頂尖專家和學者將成為文心導師,他們的專業(yè)知識與深度思考,將讓文心一言在專業(yè)領域提升自身能力,強化專業(yè)造詣,為用戶提供更具有思想深度與廣度的支持。此外,文心大模型還與《辭海》深度合作,將《辭海》龐大的數據融入文心基座大模型。
飛槳和文心大模型的生態(tài)之花,已經綻開在AI時代的土壤中。融入這個生態(tài),建設這個生態(tài),將成為AI開發(fā)者打開未來之門的鑰匙。
根植開發(fā)者:AI開發(fā)能力全面升級
開發(fā)者是文心加飛槳的根,需要把更好的開發(fā)體驗,更低的開發(fā)門檻,更充沛的開發(fā)工具交到開發(fā)者手中。面對這項工作,WAVE SUMMIT始終堅持將更好的開發(fā)能力、開發(fā)工具交付到開發(fā)者手中。根植開發(fā)者,幫助開發(fā)者,信賴開發(fā)者,是WAVE SUMMIT不變的底色。
在這一屆WAVE SUMMIT當中,百度AI技術生態(tài)總經理馬艷軍發(fā)布了飛槳開源框架2.6版本和大模型重構的開發(fā)工具鏈。
飛槳全新版本實現了開發(fā)體驗大幅提升。通過自適應圖構建機制,實現了動轉靜訓練成功率達到100%,同時,實現了高擴展性IR,支撐大模型極致性能優(yōu)化;支持動靜統一自動并行編程,混合并行訓練代碼開發(fā)大幅簡化。
在AI開發(fā)者最為關注的大模型開發(fā)層面,飛槳帶來了大模型套件全流程優(yōu)化。對大模型預訓練、精調,壓縮、推理、部署全流程關鍵技術進行了升級。同時,硬件適配方案升級,結合文心大模型的適配,更好地支持硬件廠商進行靈活定制、軟硬協同深度優(yōu)化。
在推動AI原生應用開發(fā)方面,WAVE SUMMIT展示了大模型加持的開發(fā)工具鏈。其中,智能編碼伙伴Comate AutoWork,可以實現開發(fā)者輸入需求,AutoWork即可智能規(guī)劃完成從需求到編碼上線全流程,極大降低綜合開發(fā)成本。飛槳低代碼開發(fā)工具PaddleX在飛槳開發(fā)套件能力基礎上,充分結合文心大模型,實現了AI應用開發(fā)效果和效率大幅提升。
除此之外,面向廣大開發(fā)者對大語言模型的開發(fā)需求,文心一言也推出了面向生態(tài)的開發(fā)機制。這次升級中,文心一言帶來了配套開發(fā)工具升級、優(yōu)化注入自動化流程、支撐開發(fā)者深度效果調優(yōu)、助力應用推廣四大舉措,將典型應用開發(fā)時間縮短40%以上,端到端效果提升30%以上。
至此,文心一言已經提供了面向生態(tài)的一整套開發(fā)機制,開發(fā)者可以通過API和SDK使用文心大模型的基礎能力,并支持插件開發(fā)、多工具智能編排開發(fā),提供低代碼和零代碼開發(fā)界面,全面賦能開發(fā)者進行AI原生應用開發(fā)。
結束語:翩然赴星河
在大模型生態(tài)不斷取得突破,AI開發(fā)能力不斷升級的加持下,AI可以成為每個人生活與工作中的工具,成為我們共同的機遇、能力與夢想。
為了讓更多人奔赴這場關于AI的星河之約,WAVE SUMMIT現場百度聯合啟動國內首個《大模型產業(yè)人才標準與能力評價》,新一輪飛槳人工智能教育創(chuàng)新中心落成授牌。飛槳文心生態(tài)將為更多人打開AI大門,讓人人都可以成為AI開發(fā)者。
可以確定地說,五年來,AI開發(fā)者的一切都在改變。
他們掌握了核心技術,可以用飛槳加文心去探索未知,解鎖更多生活與事業(yè)中的可能。
他們擁有了充沛的開發(fā)工具,AI開發(fā)的門檻不斷降低,助力不斷豐富,每個人都可以成為AI開發(fā)者的夢想在一步步變?yōu)楝F實。
他們建設了凝聚力極高的生態(tài),在飛槳與文心的生態(tài)體系中,開發(fā)者彼此幫助,與平臺形成良性互動,各個生態(tài)角色充分支持,AI生態(tài)變成了生機勃勃的雨林。
最重要的是,他們有了實現夢想的通道,并且相信文心加飛槳的通道會一直開啟,不斷迭代,奔涌向前。
五年來,WAVE SUMMIT從一個舞臺,一次交流,變成了一個節(jié)日,一種信賴,一場“翩然赴星河”。
“翩然赴星河”,是百度的邀請,是AI開發(fā)者的諾言,也是AI時代最為盛大的一場浪漫。
免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。