香儂科技Glyce模型打破13項中文NLP世界記錄

金融科技公司香儂科技于近日提出了Glyce模型,打破13項近乎所有中文自然語言理解(NLP)的世界紀(jì)錄,這是中國團隊在計算機理解中文方面取得的一項重要進步。加州大學(xué)圣塔芭芭拉分校教授、卡耐基梅隆大學(xué)計算機博士William Wang表示, "目前絕大多數(shù)的NLP研究基于英文,并不完全適用于漢語。Glyce利用漢字的象形表意特征,是在AI理解中文語義方面做出的重要創(chuàng)新。"

在文字中獲得想要的信息,報告被濃縮成摘要,機器可以明白你的問題快速作答。讓機器讀懂人類語言是人工智能的核心目標(biāo),也因此吸引世界科技巨頭如谷歌,F(xiàn)acebook, 蘋果,亞馬遜等大力布局自然語言處理(NLP)方向。國內(nèi)的大型互聯(lián)網(wǎng)公司和創(chuàng)業(yè)公司也都在進行各項研究。NLP領(lǐng)域因各方的參與進展飛速。香儂科技專注自然語言處理技術(shù)創(chuàng)新,表現(xiàn)十分搶眼。這個由一群最優(yōu)秀的中國年輕人組成的,平均年齡不到30歲的科技創(chuàng)業(yè)公司,帶來了全世界最好的智能中文語義理解結(jié)果。

香儂科技Glyce模型打破13項中文NLP世界記錄

很多金融機構(gòu)對香儂科技并不陌生。香儂科技致力于用AI技術(shù)實時處理海量信息,為大型金融機構(gòu)提供外源信息聚合,智能文檔審核,企業(yè)信用輿情監(jiān)測,專業(yè)金融問答,智能報告生成等服務(wù)。

香儂科技Glyce模型打破13項中文NLP世界記錄

成立僅一年,該團隊就因在NLP領(lǐng)域的技術(shù)優(yōu)勢與多家金融機構(gòu)建立了合作。據(jù)報道,香儂科技在去年9月完成了紅杉中國領(lǐng)投的1.1億元A輪融資,累計融資額近2億人民幣。香儂科技的CEO李紀(jì)為博士來自斯坦福自然語言處理實驗室,是斯坦福計算機系第一個三年畢業(yè)的博士,也是NLP領(lǐng)域?qū)W術(shù)引用最多的青年學(xué)者之一。他入選2018年福布斯中國"30位30歲以下精英榜"。團隊的其他成員也均來自世界頂尖學(xué)府,科技公司和金融機構(gòu)。

在服務(wù)金融機構(gòu)的多項業(yè)務(wù)場景中,香儂科技始終在思考,能否讓計算機更多地讀懂中文的財經(jīng)新聞,行研報告,幫助人們快速地獲取關(guān)鍵信息?香儂科技持續(xù)加大在金融領(lǐng)域的NLP研究,并提出了Glyce模型。

中文天賦其形,是象形文字,字形本身蘊含豐富的語義信息。然而當(dāng)今中文自然語言處理的方法一般借鑒于西方,所以主要機制多針對羅馬字母,而并不是適合中文象形文字。Glyce模型運用不同歷史時期的中文象形,從周商時期的金文,漢代的隸書,魏晉時期的篆書,南北朝時期的魏碑,以及繁體、簡體中文,還本溯源,將漫長歷史中豐富的中文演變,抽象成機器可以理解的符號,讓機器更好地理解中文語言。打破了13項NLP世界紀(jì)錄,對機器理解中文取得了一大進步。

香儂科技Glyce模型打破13項中文NLP世界記錄

Glyce模型在近乎所有中文自然語言處理的任務(wù)打破了歷史記錄,任務(wù)包括情感分析,句法分析, 字符級別語言模型,詞級別語言模型, 中文分詞, 實體標(biāo)注, 詞性標(biāo)注,語義角色分析, 語義相似度計算, 問答匹配, 機器翻譯, 篇章句法樹分析。Glyce作者共有九名,均來自香儂科技。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-02-13
香儂科技Glyce模型打破13項中文NLP世界記錄
金融科技公司香儂科技于近日提出了Glyce模型,打破13項近乎所有中文自然語言理解(NLP)的世界紀(jì)錄,這是中國團隊在計算機理解中文方面取得的一項重要進步。

長按掃碼 閱讀全文