AI 賦能萬物的時代已經(jīng)到來。5 月 28 日,GOTC 2023 "AIis Everywhere專題論壇 " 由 Linux 基金會亞太區(qū)副總裁楊軒擔(dān)任出品人,將于上海張江科學(xué)會堂召開。
全球開源技術(shù)峰會(Global Open-source Technology Conference,簡稱 GOTC)是由開放原子開源基金會、 Linux 基金會亞太區(qū)、上海浦東軟件園和開源中國聯(lián)合發(fā)起的,面向全球開發(fā)者的一場盛大開源技術(shù)盛宴。
GOTC 2023 為期兩天,大會將以行業(yè)展覽、主題發(fā)言、特別論壇、分論壇的形式展現(xiàn),與會者將一起探討元宇宙、3D 與游戲、eBPF、Web3.0、區(qū)塊鏈等熱門技術(shù)主題,以及開源社區(qū)、AIGC、汽車軟件、AI 編程、開源教育培訓(xùn)、云原生等熱門話題,探討開源未來,助力開源發(fā)展。
AI 已經(jīng)顛覆世界,GOTC 2023報名通道現(xiàn)已開啟:https://www.bagevent.com/event/8387611,來吧,一起走進AIis Everywhere專題論壇,探討開源 AI 的未來。
大會亮點:
AI與數(shù)據(jù)、數(shù)據(jù)庫的未來
訓(xùn)練框架、推理模型、算法量產(chǎn)
詳解PyTorch 2.0體系結(jié)構(gòu)
大模型與多模態(tài)技術(shù)、AI應(yīng)用落地實踐
出品人:楊軒
現(xiàn)為 Linux 基金會亞太區(qū)副總裁,擁有超過 20 年軟件行業(yè)經(jīng)驗,曾在 Saba、Sumtotal、Computer Associates 等大型國際軟件公司擔(dān)任高級管理職務(wù)。擁有豐富的企業(yè)級軟件應(yīng)用和開發(fā)經(jīng)驗,以及軟件開源和數(shù)字化轉(zhuǎn)型實踐經(jīng)驗。
議題:Welcome and Introduction
演講時間:9:00-9:20
演講嘉賓:譚中意 | LF AI Outreach 主席
議題:Keynote
演講時間:9:20-9:40
演講嘉賓:Ibrahim Haddad | LF AI & Data 基金會執(zhí)行董事、PyTorch 基金會執(zhí)行董事
議題:AI & Data: painpoints and the future.
演講時間:9:40-10:00
演講嘉賓:堵俊平 | LF AI & Data Board Chair、ASF Member
議題簡介:當(dāng)下,由 ChatGPT 引爆的大語言模型革命正在產(chǎn)生深遠影響。作為智能時代最稀缺的資源之一,數(shù)據(jù)的重要性毋庸置疑,也經(jīng)常成為各大企業(yè)與研究機構(gòu)模型研發(fā)與調(diào)優(yōu)的瓶頸。本議題重點討論大模型背后的數(shù)據(jù)痛點以及面向未來的應(yīng)對方案。
議題:大規(guī)模語言模型在智能文檔問答的應(yīng)用:基于Langchain和Langchain-serve的解決方案
演講時間:10:00-10:20
演講嘉賓:王楠 | Jina AI 聯(lián)合創(chuàng)始人兼 CTO
議題簡介:文檔問答系統(tǒng)的任務(wù)是從文檔數(shù)據(jù)中查找與用戶問題相關(guān)的答案。由于文檔數(shù)量不斷增加,傳統(tǒng)的搜索已經(jīng)不能滿足人們的需求。隨著深度學(xué)習(xí)模型的發(fā)展,文檔問答系統(tǒng)從基于字符匹配的方法遷移到基于向量表示的方法。但是,它們?nèi)匀恢荒芊祷嘏c問題相關(guān)的段落,不能直接給出問題的答案,尤其是對于是否類問題。最近,大規(guī)模語言模型的能力不斷提升,為文檔問答系統(tǒng)的答案生成問題提供了解決方案。新一代的文檔問答系統(tǒng)將傳統(tǒng)模型、深度學(xué)習(xí)問答模型和大規(guī)模語言模型技術(shù)融合在一起,為用戶提供更完善的文檔問答服務(wù)。本次演講將介紹如何使用 Langchain 開發(fā)框架和 Langchain-serve 部署工具來開發(fā)智能文檔問答系統(tǒng)。
議題:昇思大模型一站式易用實踐
演講時間:10:20-10:40
演講嘉賓:何蘆微 | 華為資深開源工程師
議題簡介:人工智能發(fā)展到今天,已經(jīng)從” 大煉模型 “逐步邁向” 煉大模型 “。相比傳統(tǒng)針對特定應(yīng)用場景需求進行訓(xùn)練的模型,大模型泛化能力強,不再局限于單一特定場景,也因此它需要更大更廣數(shù)據(jù)量的” 投喂 “,需要更強的算力訓(xùn)練,這些都需要巨量的成本,絕大部分開發(fā)者基本無法承擔(dān),如何降低大模型的訓(xùn)練和應(yīng)用門檻成了新的難題。 在本次議題中,我們將帶來昇思大模型一站式易用實踐分享,介紹昇思 MindSpore 社區(qū)打造的一站式大模型平臺,它集模型選型、在線推理、在線訓(xùn)練為一體,支持大模型的在線體驗及微調(diào),讓開發(fā)者零距離接觸紫東?太初以文生文,悟空畫畫以文生圖,Luojia 遙感檢測等大模型應(yīng)用。
議題:AI數(shù)據(jù)庫OpenMLDB應(yīng)用實踐
演講時間:10:40-11:00
演講嘉賓:陳迪豪 | 第四范式架構(gòu)師
議題簡介:AI 已經(jīng)成為計算機基礎(chǔ)架構(gòu)中不可或缺的一環(huán),而針對 AI 場景優(yōu)化的數(shù)據(jù)庫也應(yīng)運而生。AI 數(shù)據(jù)庫不僅功能上要滿足特征工程以及機器學(xué)習(xí)模型的上線需求,在離線和在線性能上也有更高的要求。本次分享將以 OpenMLDB 項目為例,深入介紹 AI 數(shù)據(jù)庫的應(yīng)用場景和性能優(yōu)化,實現(xiàn)特定 AI 場景快速落地以及數(shù)倍甚至數(shù)十倍的性能提升。
議題:向量數(shù)據(jù)庫:面向AIGC的海量記憶體
演講時間:11:00-11:20
演講嘉賓:郭人通 | Zilliz 合伙人、產(chǎn)品總監(jiān)
議題簡介:在 AIGC 大火的時代,向量數(shù)據(jù)庫在海量非結(jié)構(gòu)化數(shù)據(jù)處理中發(fā)揮著越來越重要的作用,本次分享將重點介紹在 AIGC 浪潮里,向量數(shù)據(jù)庫如何為 AI 賦能。
議題:PyTorch 2.0:將編譯器技術(shù)引入PyTorch內(nèi)核
演講時間:11:20-11:55
演講嘉賓:Peng Wu | Engineering Manager supporting the PyTorch compiler team
議題簡介:PyTorch 2.0 利用編譯器實現(xiàn)更快的訓(xùn)練和推理,同時不犧牲 PyTorch 的靈活性和易用性。本次演講將概述新 torch.compile () API 背后的技術(shù)棧,并討論 PyTorch 2.0 的關(guān)鍵特性,包括其完全向后兼容以及模型訓(xùn)練速度提高 43%。我們將介紹各種堆棧組件,如 TorchDynamo、AOTAutograd、PrimTorch 和 TorchInductor,以及它們?nèi)绾螀f(xié)同工作以簡化模型開發(fā)過程。參會者將更深入地了解 PyTorch 2.0 架構(gòu)以及在深度學(xué)習(xí)框架中整合編譯器技術(shù)所帶來的優(yōu)勢。
議題:開源深度學(xué)習(xí)框架飛槳及其開源社區(qū)
演講時間:13:30-14:00
演講嘉賓:張軍 | 百度飛槳框架產(chǎn)品負責(zé)人、開放原子開源基金會 TOC 委員
議題簡介:本報告結(jié)合生成式 AI 的最新發(fā)展趨勢和百度的實踐,介紹百度深度學(xué)習(xí)平臺 + 大模型核心技術(shù)研發(fā)、產(chǎn)品創(chuàng)新和生態(tài)建設(shè)的進展。報告同時分享圍繞飛槳產(chǎn)業(yè)級深度學(xué)習(xí)開源開放平臺、在新趨勢下開展產(chǎn)教融合教育生態(tài)建設(shè)的思考。
議題:當(dāng)聯(lián)邦學(xué)習(xí)遇到大型語言模型
演講時間:14:00-14:20
演講嘉賓:彭麟 | VMware CTO 辦公室資深研究員
議題簡介:聯(lián)邦學(xué)習(xí)使得多個數(shù)據(jù)源可以在不共享數(shù)據(jù)的情況下協(xié)同訓(xùn)練一個模型。近年來,基于 transformer 的大型語言模型越來越受歡迎。然而,這些模型由于其高計算資源需求和復(fù)雜算法而帶來挑戰(zhàn)。在本次演講中,我們將介紹 FATE 在金融用例中將聯(lián)邦學(xué)習(xí)應(yīng)用于 GPT-J、ChatGLM-6B、GLM 和 LLaMA 等大型語言模型方面的最新努力。FATE 將聯(lián)邦學(xué)習(xí)的分布式訓(xùn)練機制與大規(guī)模模型相結(jié)合,在保持各方敏感數(shù)據(jù)僅限于本地域內(nèi)的同時允許根據(jù)每個參與者實際數(shù)據(jù)量進行計算投入。這使得能夠共同培訓(xùn)大規(guī)模模式并互惠互利。我們還將探討技術(shù)和實踐考慮因素、現(xiàn)實世界用例以及對隱私保護機制的需求。
議題:模型推理優(yōu)化,探索AI落地潛能
演講時間:14:20-14:40
演講嘉賓:袁麗雅 | 中興通訊標(biāo)準(zhǔn)及開源高級工程師
議題簡介:大模型的趨勢已經(jīng)勢不可擋,如何提高模型推理效率成為亟待解決的問題。本報告將介紹模型推理優(yōu)化的技術(shù)現(xiàn)狀及趨勢,并分享 Adlik 項目在該領(lǐng)域的實踐。
議題:Xtreme1下一代多模態(tài)開源訓(xùn)練數(shù)據(jù)平臺
演講時間:14:40-15:00
演講嘉賓:王家軍 | 倍賽科技技術(shù)研發(fā)總監(jiān)
議題簡介:UBS Global 研究報告發(fā)現(xiàn):現(xiàn)如今 AI 工程師 70%-90% 的時間都花費在訓(xùn)練數(shù)據(jù)上。很多算法在實踐中已非常優(yōu)秀,數(shù)據(jù)已然成為 AI 模型開發(fā)新的瓶頸?;谝陨犀F(xiàn)狀,倍賽科技團隊研發(fā)出 Xtreme1 訓(xùn)練數(shù)據(jù)平臺,致力構(gòu)建最容易觸達的開源 Data-Centric MLOps 基礎(chǔ)設(shè)施,以連接人、模型和數(shù)據(jù)。Xtreme1 首次引入本體 Ontology 來穿透不同 AI 客戶的問題抽象,是全球首個支持多模態(tài)數(shù)據(jù)標(biāo)注的開源工具,全面遵循云原生架構(gòu)原則,以保證服務(wù)性能的可擴展性,部署規(guī)模的可彈性,以及在故障情況下的服務(wù)韌性。
議題:OPPO移動端圖形技術(shù)領(lǐng)域探索實踐 ——O3DE Mobile WG及shaderNN
演講時間:15:00-15:20
演講嘉賓:彭周虎 | OPPO 開源辦公室負責(zé)人
議題簡介:近年來,隨著移動端算力的不斷提升和深度學(xué)習(xí)研究的快速發(fā)展,特別是小網(wǎng)絡(luò)模型不斷成熟以及數(shù)據(jù)安全的要求越來越高,越來越多的原本在云端執(zhí)行的推理轉(zhuǎn)移到移動端上來實現(xiàn)。移動平臺的深度學(xué)習(xí)推理涉及硬件平臺、驅(qū)動、編譯優(yōu)化、模型壓縮、算子算法優(yōu)化以及部署,適合系統(tǒng)業(yè)務(wù)開發(fā)的高效推理框架成為業(yè)界迫切需求和開發(fā)重點。
基于移動端圖形圖像后處理高效 AI 推理需求,為降低業(yè)務(wù)融合成本,提高效能,我們開發(fā)了基于 GPU Shader 高效推理引擎 ShaderNN。它直接基于 GPU 紋理進行高效推理以節(jié)省 I/O 時間, 不依賴第三方庫,跨不同硬件平臺,支持主流深度學(xué)習(xí)訓(xùn)練框架,可定制,方便優(yōu)化、集成、部署和升級。
議題:英特爾的PyTorch之旅:AI算力提升和開源軟件優(yōu)化
演講時間:15:40-16:00
演講嘉賓:馬鳴飛 | Senior Deep Learning Software Engineer
議題簡介:PyTorch 是深度學(xué)習(xí)和機器學(xué)習(xí)最流行的框架之一,英特爾一直是 PyTorch 社區(qū)的長期貢獻者和宣傳者。在本次演講中,我們將分享在核心框架及其生態(tài)系統(tǒng)庫中為 PyTorch 做出貢獻的經(jīng)驗。我們將詳細介紹我們在 torch.compile 中的優(yōu)化,這是 PyTorch 2.0 的旗艦新功能,并展示其在 CPU 上的性能優(yōu)勢。我們將展示如何通過硬件算力的提升和開源軟件的優(yōu)化,讓 AI 應(yīng)用更加平民化,如基于擴散的生成式 AI 和大語言模型。 我們還將介紹過去參與的一些 PyTorch 生態(tài)系統(tǒng)項目,例如 HuggingFace,DeepSpeed,PyG 等等。最后,我們將討論未來的計劃和愿景,繼續(xù)與 PyTorch 基金會合作,以推動深度學(xué)習(xí)和機器學(xué)習(xí)朝著更好的方向發(fā)展。
議題:DeepRec:面向推薦場景的高性能深度學(xué)習(xí)框架
演講時間:16:00-16:20
演講嘉賓:演講嘉賓:丁辰 | 阿里云 PAI 技術(shù)專家
議題簡介:DeepRec 是阿里云機器學(xué)習(xí)平臺 PAI 開源的面向推薦場景的高性能深度學(xué)習(xí)框架,針對稀疏模型在分布式、圖優(yōu)化、算子、Runtime 等方面進行了深度的性能優(yōu)化,同時提供了動態(tài)彈性特征,動態(tài)彈性維度,自適應(yīng) EmbeddingVariable、增量模型導(dǎo)出及加載等一系列功能。DeepRec 在阿里巴巴集團內(nèi)部應(yīng)用于淘寶、天貓、阿里媽媽、高德、淘特、AliExpress、Lazada 等,在核心業(yè)務(wù)上支撐著千億特征、萬億樣本的超大規(guī)模稀疏訓(xùn)練。DeepRec 開源一年多以來,已經(jīng)在數(shù)十家公司的搜推廣業(yè)務(wù)場景中大規(guī)模應(yīng)用,帶來了巨大的業(yè)務(wù)價值。
議題:曠視算法量產(chǎn)與MegEngine生態(tài)建設(shè)
演講時間:16:20-16:40
演講嘉賓:陳其友 | 曠視科技 MegEngine 團隊負責(zé)人
議題簡介:目前 AI 技術(shù)應(yīng)用已經(jīng)在各種領(lǐng)域得到驗證,它具有比傳統(tǒng)算法更高的生產(chǎn)力。但是隨著大量的 AI 算法的需求,傳統(tǒng)的針對某個具體場景進行數(shù)據(jù)采集,標(biāo)注,模型訓(xùn)練,驗證,交付的算法生成方式成為了 AI 落地的瓶頸。MegEngine 團隊圍繞 MegEngine 訓(xùn)練框架,提出一種基于各個階段標(biāo)準(zhǔn)化的算法量產(chǎn)的方法來減低 AI 落地的門檻,為了實現(xiàn)算法量產(chǎn),MegEngine 開發(fā)了一系列組件,他們共同形成了 MegEngine 的算法量產(chǎn)的生態(tài),正在逐步開源。
議題:Primus——通用的分布式訓(xùn)練調(diào)度框架
演講時間:16:40-17:00
演講嘉賓:徐合邦 | 字節(jié)跳動基礎(chǔ)架構(gòu)計算框架研發(fā)工程師
議題簡介:近些年來,機器學(xué)習(xí)科技已經(jīng)深植各應(yīng)用領(lǐng)域,并且成功帶來顯著的提升。面對與日具增的訓(xùn)練資料和模型規(guī)模,為了滿足更高效率的模型訓(xùn)練,分布式訓(xùn)練的概念順應(yīng)而生。作為一個通用的分布式訓(xùn)練調(diào)度框架,Primus 提供一個通用的介面橋接了分布式訓(xùn)練任務(wù)和物理計算資源,讓資料科學(xué)家可以專注與學(xué)習(xí)算法的設(shè)計,并且讓分散式訓(xùn)練任務(wù)可以運行在不同種類的計算集群,例如 Kubernetes 和 YARN。于此基礎(chǔ)上,Primus 更提供了分布式訓(xùn)練任務(wù)所需的容錯能力以及資料調(diào)度能力,進而更提升了分布式訓(xùn)練的易用性。本議題將分享 Primus 在字節(jié)跳動的站內(nèi)現(xiàn)況及實踐,Primus 和分布式訓(xùn)練領(lǐng)域的相關(guān)挑戰(zhàn)、及未來展望。
議題:透明后端圖編譯器無縫提升ML上游框架
演講時間:17:00-17:20
演講嘉賓:Tiejun Chen | Sr. Technical lead
議題簡介:當(dāng)前有一個新興趨勢:觀測性從云向邊緣轉(zhuǎn)移,這時 AI 工作負載往往通過高層級 ML 框架(如 Ray)進行管理和編排。但與此同時,各種廠商的 AI 加速器(如 Nvidia GPU 系列、Intel Movidius VPU、Google TPU 等)已經(jīng)實現(xiàn)了 AI 加速。實際上可以看到許多基于 ASIC 的 AI 加速器。另一方面,存在著各種圖編譯器(如 TVM、Intel OpenVINO、TensorRT 等)用來提高 ML 性能,但碎片化嚴(yán)重。因此,在現(xiàn)實世界中用戶在賦予這些異構(gòu) AI 加速器不同軟件加速時面臨挑戰(zhàn),原因是缺少一個自然支持它們的通用統(tǒng)一框架。本次演講將分享引入透明后端加速技術(shù)來自動提升流行 ML 上游框架(如 Tensorflow、Pytorch、TorchServe、Tensorflow Serving 等)上異構(gòu) AI 加速器上的 ML 性能,并與那些主流 ML 圖編譯器無縫結(jié)合。通過我們對主流 ML 框架零代碼更改方法,用戶可以在他們原始的 AI 應(yīng)用上看到提升的 ML/AI 性能。
議題:OpenGPT:LMM多模態(tài)大模型推理框架
演講時間:17:20-17:40
演講嘉賓:王峰 | Jina AI 高級算法工程師
議題簡介:大語言模型和多模態(tài)技術(shù)已經(jīng)成為趨勢,以 GPT-4 為代表的 AI 能力的提升,從實現(xiàn)單調(diào)的文本交互,轉(zhuǎn)變?yōu)榭梢越邮軋D像、文本作為輸入。越來越多基于大模型的多模態(tài)技術(shù)涌現(xiàn)出來,但是在實際工業(yè)產(chǎn)品落地過程中仍然存在諸多挑戰(zhàn)。特別是針對模型推理問題又有更多新的問題需要解決。本次分享將以 OpenGPT 項目為例來介紹 Jina AI 在解決大模型產(chǎn)品落地問題的實踐。
0635
全球開源技術(shù)峰會(Global Open-source Technology Conference,簡稱 GOTC)是由開放原子開源基金會、 Linux 基金會亞太區(qū)、上海浦東軟件園和開源中國聯(lián)合發(fā)起的,面向全球開發(fā)者的一場盛大開源技術(shù)盛宴。
GOTC 2023 將于 5 月 27 日至 28 日在上海張江科學(xué)會堂召開。大會將以行業(yè)展覽、主題發(fā)言、特別論壇、分論壇的形式展現(xiàn),與會者將一起探討元宇宙、3D 與游戲、eBPF、Web3.0、區(qū)塊鏈等熱門技術(shù)主題,以及開源社區(qū)、AIGC、汽車軟件、AI 編程、開源教育培訓(xùn)、云原生等熱門話題,探討開源未來,助力開源發(fā)展。
GOTC 2023報名通道現(xiàn)已開啟,誠邀全球各技術(shù)領(lǐng)域開源愛好者共襄盛舉!
參會報名,請訪問:https://www.bagevent.com/event/8387611
進入官網(wǎng)了解更多信息,請訪問:https://gotc.oschina.net
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )