12月12日消息,由深度學(xué)習(xí)技術(shù)及應(yīng)用國(guó)家工程實(shí)驗(yàn)室主辦的WAVE SUMMIT+ 2021深度學(xué)習(xí)開發(fā)者峰會(huì)今日召開。此次峰會(huì),飛槳開源框架v2.2重磅亮相。
百度深度學(xué)習(xí)技術(shù)平臺(tái)部高級(jí)總監(jiān)馬艷軍與百度AI產(chǎn)品研發(fā)部總監(jiān)忻舟,就飛槳新版 本特性與落地部署應(yīng)用做了詳盡解讀。
飛槳新版本將如何在解決AI落地產(chǎn)業(yè)方面提供全新解答?一起看看。
踐行融合創(chuàng)新,飛槳核心技術(shù)持續(xù)積累與突破
峰會(huì)現(xiàn)場(chǎng),馬艷軍表示,飛槳作為中國(guó)首個(gè)自主研發(fā)、功能豐富、開源開放的產(chǎn)業(yè)級(jí)深度學(xué)習(xí)平臺(tái),核心技術(shù)持續(xù)積累與突破,全新發(fā)布的開源框架2.2版本,涉及深度學(xué)習(xí)開發(fā)、訓(xùn)練、文本任務(wù)極致優(yōu)化、硬件高效適配、低門檻推理部署等多方面創(chuàng)新性技術(shù),賦能開發(fā)者,為產(chǎn)業(yè)應(yīng)用和前沿探索提供技術(shù)源動(dòng)力。
開發(fā)方面,飛槳提供豐富的API,支持開發(fā)者便捷、高效地開發(fā)深度學(xué)習(xí)模型。飛槳框架v2.2的API更加豐富、高效并保持良好的兼容性,有針對(duì)性地豐富了100多個(gè)API,可支持更廣泛模型開發(fā),尤其針對(duì)科學(xué)計(jì)算的模型應(yīng)用,增加了傅里葉變換、Jacobian/Hessian/VJP/JVP等一系列API,支持量子計(jì)算、生命科學(xué)、計(jì)算流體力學(xué)、分子動(dòng)力學(xué)等應(yīng)用,助力前沿技術(shù)探索。
訓(xùn)練方面,全新發(fā)布端到端自適應(yīng)大規(guī)模分布式訓(xùn)練技術(shù)。針對(duì)不同的模型和硬件,抽象成統(tǒng)一的分布式計(jì)算視圖和資源視圖,并通過硬件感知切分和映射功能及端到端的代價(jià)模型,搜索出最優(yōu)的模型切分和硬件組合策略,將模型參數(shù)、梯度、優(yōu)化器狀態(tài)按照最優(yōu)策略分配到不同的計(jì)算卡上,達(dá)到節(jié)省存儲(chǔ)、負(fù)載均衡、提升訓(xùn)練性能的目的。
基于全新的端到端自適應(yīng)大規(guī)模分布式訓(xùn)練技術(shù),百度飛槳在鵬城云腦II集群上采用自適應(yīng)優(yōu)化,訓(xùn)練速度達(dá)到優(yōu)化前2.1倍。而近期發(fā)布的全球首個(gè)知識(shí)增強(qiáng)千億大模型鵬城-百度·文心,也是基于端到端自適應(yīng)大規(guī)模分布式訓(xùn)練技術(shù)。
文本任務(wù)方面,從文本處理、訓(xùn)練、解碼到部署進(jìn)行全面加速。升級(jí)對(duì)字符串張量的支持,為開發(fā)者提供端到端文本任務(wù)開發(fā)體驗(yàn)。在預(yù)訓(xùn)練模型方面,針對(duì)Transformer Encoder的網(wǎng)絡(luò)結(jié)構(gòu)實(shí)現(xiàn)了極致的性能優(yōu)化,并通過自定義算子功能,融合了NVIDIA FasterTransformer的高性能算子。基于這些優(yōu)化,框架針對(duì)預(yù)訓(xùn)練模型形成了訓(xùn)推一體全流程開發(fā)體驗(yàn),讓部署代碼節(jié)省94%。
硬件接入方面,多層次、低成本的硬件適配方案降低了框架與芯片的適配成本。百度自研Kernel Primitive API、NNAdapter、編譯器CINN(預(yù)發(fā)布)三大優(yōu)化方案,分別對(duì)AI算子庫(kù)、圖、編譯器后端進(jìn)行軟硬件結(jié)合的深度融合優(yōu)化,極大降低了硬件適配成本,賦能硬件生態(tài)圈。
持續(xù)降低應(yīng)用門檻,飛槳模型庫(kù)、企業(yè)版全新升級(jí)
除了飛槳深度學(xué)習(xí)框架技術(shù)的領(lǐng)先發(fā)布,峰會(huì)還帶來了飛槳產(chǎn)業(yè)級(jí)開源模型庫(kù)和企業(yè)版的全新升級(jí)。
馬艷軍在會(huì)上表示,目前,百度飛槳官方支持的產(chǎn)業(yè)級(jí)開源算法模型超過400個(gè),并發(fā)布13個(gè)PP系列模型,在精度和性能上達(dá)到平衡,將推理部署工具鏈徹底打通。
飛槳產(chǎn)業(yè)應(yīng)用能力全方位升級(jí)的同時(shí),飛槳企業(yè)版也在著力提升模型部署能力。會(huì)上,忻舟帶來了飛槳企業(yè)版模型部署升級(jí)和飛槳EsayDL桌面版的全新發(fā)布。
飛槳企業(yè)版包括EasyDL和BML雙平臺(tái)開發(fā)模式,致力于提升AI開發(fā)效率和資源使用效能,目前已經(jīng)成為應(yīng)用和落地最廣泛的AI開發(fā)平臺(tái)。此次模型部署的全新升級(jí)基于飛槳推理部署工具鏈,與平臺(tái)深度融合,打造自動(dòng)高效的企業(yè)級(jí)部署功能。
首先是全自動(dòng)模型組合壓縮,顯著提升推理性能?;赑addleSlim,根據(jù)不同模型和硬件的特點(diǎn),設(shè)計(jì)了多條全自動(dòng)組合壓縮流水線,能夠自動(dòng)選擇最佳壓縮路徑。對(duì)常見的模型,精度損失控制在1%下,加速比能達(dá)到3-5倍。
其次基于飛槳推理引擎,廣泛適配推理芯片。新版本采用了飛槳推理引擎,廣泛適配推理芯片且性能優(yōu)異。目前,平臺(tái)已完成9345種模型芯片的組合的真實(shí)測(cè)試和調(diào)優(yōu),可以覆蓋95%的需求場(chǎng)景,相比自行適配節(jié)省97%的開發(fā)時(shí)間。
最后是模型服務(wù)化與智能邊緣控制臺(tái),大幅提高部署效率。尤其是全新發(fā)布的智能邊緣控制臺(tái),提供了全可視化的操作界面,使得模型與業(yè)務(wù)集成的效率顯著提升,模型部署時(shí)間從天級(jí)別縮短至5分鐘。忻舟現(xiàn)場(chǎng)演示了如何5分鐘讓機(jī)器狗學(xué)會(huì)手勢(shì)識(shí)別的新技能。
最后,飛槳EasyDL桌面版全新發(fā)布。開發(fā)者不必繁瑣的配置各種環(huán)境,在桌面一鍵極速安裝即可實(shí)現(xiàn)本地高效建模,1分鐘安裝完成,15分鐘就可完成模型開發(fā),本地實(shí)現(xiàn)數(shù)據(jù)管理、算力調(diào)度、部署應(yīng)用,讓AI“觸手可得”。
源于產(chǎn)業(yè)實(shí)踐的百度飛槳產(chǎn)業(yè)級(jí)深度學(xué)習(xí)開源開放平臺(tái),是百度踐行融合創(chuàng)新、降低行業(yè)發(fā)展門檻的AI大生產(chǎn)平臺(tái)。飛槳的一代一代迭代更新,更是中國(guó)人工智能產(chǎn)業(yè)的一步一步的向上攀登。AI促動(dòng)中國(guó)產(chǎn)業(yè)繁榮,飛槳一直在路上。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )