阿里達(dá)摩院33篇論文被國(guó)際頂會(huì)收錄,多項(xiàng)成果已開(kāi)放

12月7日,自然語(yǔ)言處理國(guó)際頂會(huì)EMNLP 2022在阿聯(lián)酋阿布扎比召開(kāi),本次大會(huì),中國(guó)研究團(tuán)隊(duì)表現(xiàn)優(yōu)異,阿里巴巴達(dá)摩院共有33篇論文被接收,是論文入選數(shù)量最多的研究機(jī)構(gòu)之一。達(dá)摩院相關(guān)研究成果涵蓋跨模態(tài)理解和生成預(yù)訓(xùn)練、知識(shí)增強(qiáng)的多語(yǔ)言預(yù)訓(xùn)練、具有自我評(píng)估能力的機(jī)器翻譯等領(lǐng)域,多項(xiàng)成果已在魔搭社區(qū)ModelScope平臺(tái)開(kāi)放。

EMNLP 2022在阿布扎比召開(kāi)

EMNLP是自然語(yǔ)言處理領(lǐng)域高影響力的會(huì)議之一,其在Google Scholar計(jì)算語(yǔ)言學(xué)刊物指標(biāo)中排名第二。和傳統(tǒng)學(xué)術(shù)會(huì)議不同,EMNLP更注重自然語(yǔ)言算法與各領(lǐng)域應(yīng)用的結(jié)合,吸引了Google、微軟、麻省理工學(xué)院等全球頂級(jí)科技公司和研究機(jī)構(gòu)的參與。據(jù)介紹,今年大會(huì)主會(huì)和Findings共接收1381篇論文,其中主會(huì)接收論文829篇,接收率創(chuàng)新低僅為20%。達(dá)摩院共有22篇論文被主會(huì)接收,11篇論文被接收為Findings(不上主會(huì)報(bào)告的論文)。

達(dá)摩院NLP實(shí)驗(yàn)室資深算法專家邴立東在本次大會(huì)上共有8篇論文入選主會(huì),個(gè)人入選論文數(shù)量位居全球研究者前列。他表示:“今年大會(huì)學(xué)術(shù)界和工業(yè)界的研究趨勢(shì)仍在發(fā)生微妙的變化,語(yǔ)言模型 (Language Model) 相關(guān)的研究熱度居高不下,有155篇論文在標(biāo)題里提到了該關(guān)鍵詞,此外跨模態(tài)預(yù)訓(xùn)練、文本生成、對(duì)比學(xué)習(xí)等領(lǐng)域的論文數(shù)量也在持續(xù)增長(zhǎng)?!?/p>

EMNLP 2022大會(huì)首日議程

以大模型為例,達(dá)摩院創(chuàng)新性地提出了skip-connected網(wǎng)絡(luò)結(jié)構(gòu),可解決當(dāng)下多模態(tài)預(yù)訓(xùn)練模型訓(xùn)練和推理效率低,以及跨模態(tài)對(duì)齊模塊中存在語(yǔ)義信息被視覺(jué)序列掩蓋的問(wèn)題,該網(wǎng)絡(luò)可提高視覺(jué)表示中self-attention的計(jì)算效率,提速至少4倍。實(shí)驗(yàn)結(jié)果顯示,基于該網(wǎng)絡(luò),達(dá)摩院通義AliceMind體系下的多模態(tài)預(yù)訓(xùn)練模型mPLUG用1300萬(wàn)公開(kāi)圖文數(shù)據(jù)預(yù)訓(xùn)練的模型,超越了傳統(tǒng)模型上億訓(xùn)練數(shù)據(jù)的效果。相關(guān)研究可應(yīng)用于圖像描述、圖文檢索、視覺(jué)定位和視覺(jué)問(wèn)答等領(lǐng)域,基于該底座,達(dá)摩院于2021年在VQA(視覺(jué)問(wèn)答)任務(wù)上實(shí)現(xiàn)了首次超越人類結(jié)果的突破。

據(jù)介紹,達(dá)摩院研發(fā)的阿里通義AliceMind體系涵蓋預(yù)訓(xùn)練模型、多語(yǔ)言預(yù)訓(xùn)練模型、超大中文預(yù)訓(xùn)練模型等,具備閱讀理解、機(jī)器翻譯、對(duì)話問(wèn)答、文檔處理等多種能力,該模型體系已斬獲36項(xiàng)冠軍。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2022-12-07
阿里達(dá)摩院33篇論文被國(guó)際頂會(huì)收錄,多項(xiàng)成果已開(kāi)放
12月7日,自然語(yǔ)言處理國(guó)際頂會(huì)EMNLP 2022在阿聯(lián)酋阿布扎比召開(kāi),本次大會(huì),中國(guó)研究團(tuán)隊(duì)表現(xiàn)優(yōu)異,阿里巴巴達(dá)摩院共有33篇論文被接收,是論文入選數(shù)量最多的研究機(jī)構(gòu)之一。達(dá)摩院相關(guān)研究成果涵蓋跨模態(tài)理解和生成預(yù)訓(xùn)練、

長(zhǎng)按掃碼 閱讀全文