專訪丨文因互聯(lián)CEO鮑捷:連接一切,建起金融數(shù)據(jù)的高速公路

新一代科技革命蓬勃發(fā)展,不斷催生新的產(chǎn)業(yè)形態(tài)和商業(yè)模式。金融行業(yè)在歷經(jīng)電子化、移動(dòng)化之后,也進(jìn)入了金融與科技相結(jié)合的新階段-智能金融時(shí)代。因?yàn)榕c數(shù)據(jù)高度相關(guān),金融行業(yè)也一直被認(rèn)為是人工智能落地最好、最快、最有商業(yè)價(jià)值的場景。

2018年12月14至16日,由中國人工智能學(xué)會(huì)、永泰縣人民政府主辦,中國科學(xué)技術(shù)出版社協(xié)辦的第二期全球高?!度斯ぶ悄軐?dǎo)論》師資培訓(xùn)班在福州永泰縣召開。文因互聯(lián)CEO鮑捷在現(xiàn)場帶來了關(guān)于知識(shí)圖譜的報(bào)告。會(huì)后,億歐就智能金融和人工智能等相關(guān)問題專訪了鮑捷。

文因互聯(lián)是一家智能金融解決方案提供商,主要利用自然語言處理和知識(shí)圖譜技術(shù),對(duì)金融數(shù)據(jù)進(jìn)行結(jié)構(gòu)化提取和智能化分析。整合金融機(jī)構(gòu)內(nèi)外部數(shù)據(jù),從而利用銀行、監(jiān)管機(jī)構(gòu),基金證券等持有的海量數(shù)據(jù),實(shí)現(xiàn)監(jiān)管、獲客、風(fēng)控等場景的自動(dòng)化。累計(jì)服務(wù)了招商銀行、平安銀行、南京銀行、普華永道、天風(fēng)證券等多家金融機(jī)構(gòu)。目前,文因互聯(lián)正在進(jìn)行下一輪的融資。

知識(shí)圖譜-催化劑、濃縮軸和打折卡

當(dāng)我們談到智能金融的技術(shù)基石時(shí),更多的人會(huì)說機(jī)器學(xué)習(xí)、自然語言理解等,但很少有人會(huì)提到知識(shí)圖譜。但是在眾多的智能金融應(yīng)用場景中,如智能風(fēng)控、智能投顧、智能投研、智能監(jiān)管等,很多時(shí)候都是機(jī)器學(xué)習(xí)和知識(shí)圖譜共同發(fā)揮作用的結(jié)果。

知識(shí)圖譜最早由Google公司在2012年提出。從學(xué)術(shù)的角度,我們可以對(duì)知識(shí)圖譜給一個(gè)這樣的定義:知識(shí)圖譜本質(zhì)上是一種叫做語義網(wǎng)絡(luò)的知識(shí)庫。從實(shí)際應(yīng)用的角度出發(fā)其實(shí)可以簡單地把知識(shí)圖譜理解成多關(guān)系圖。

鮑捷從1998年開始從事人工智能方面的研究,主要聚焦在語義網(wǎng)/知識(shí)圖譜。鮑捷表示,他對(duì)具體算法過程不感興趣,如何解決問題才是他的興趣所在。他本人有個(gè)窮盡一生想要解決的目標(biāo),那就是將世界所有的知識(shí)聯(lián)系在一起,而知識(shí)圖譜能幫助他完成這一目標(biāo)。

知識(shí)圖譜可以說是一種應(yīng)用于諸多人工智能相關(guān)領(lǐng)域的關(guān)鍵技術(shù),它主要應(yīng)用于數(shù)據(jù)結(jié)構(gòu)化處理、解析、關(guān)聯(lián)和后續(xù)的分析與推理。按照鮑捷的話說,知識(shí)圖譜是一種催化劑,濃縮軸和打折卡。一方面它能加速價(jià)值的產(chǎn)生,在數(shù)據(jù)聚合中產(chǎn)生新的數(shù)據(jù),例如本體映射;另一方面它可以提煉大量知識(shí)和數(shù)據(jù),是一種流動(dòng)性好,摩擦力特別小的數(shù)據(jù),例如百科數(shù)據(jù);它同時(shí)也是能降低成本,利用先驗(yàn)知識(shí)大幅提高價(jià)值的數(shù)據(jù),例如基因本體。

“目前國內(nèi)做智能金融的企業(yè)主要聚焦在智能投顧和智能投研方面,人工智能應(yīng)用在金融行業(yè)應(yīng)用的切入點(diǎn)不應(yīng)該是這樣的。”鮑捷表示,我們所講的金融大工業(yè)化,增強(qiáng)的不應(yīng)該只是一兩個(gè)人的能力,而是多人協(xié)作的能力。它的核心問題是如何實(shí)現(xiàn)金融知識(shí)結(jié)構(gòu)的沉淀和業(yè)務(wù)流程的自動(dòng)化。

這個(gè)難點(diǎn)在于怎樣做到用機(jī)器理解文檔,并且讓機(jī)器理解金融知識(shí)。前一項(xiàng)技術(shù)涉及自然語言處理技術(shù),后一項(xiàng)技術(shù)涉及知識(shí)圖譜技術(shù)。文因互聯(lián)所做的事情就是結(jié)合這兩項(xiàng)技術(shù),在金融行業(yè)進(jìn)行落地。這就要求企業(yè)具備全鏈條的數(shù)據(jù)結(jié)構(gòu)化能力,包括財(cái)務(wù)報(bào)表的公開化提取能力,還有公告、研報(bào)、法規(guī)的解析,解析后再進(jìn)行實(shí)體鏈接,映射到知識(shí)圖譜上,之后是規(guī)則建模與推理、語義搜索、自然語言問答。

鮑捷告訴億歐,希望能在5年時(shí)間內(nèi),在所有的金融機(jī)構(gòu)、政府、研究機(jī)構(gòu)間構(gòu)造出一個(gè)巨大的近乎實(shí)時(shí)的數(shù)據(jù)分發(fā)網(wǎng)絡(luò),即“金融數(shù)據(jù)高速公路”,加快各金融機(jī)構(gòu)間的信息流通速度。

實(shí)現(xiàn)AI,不一定需要先了解人腦

歷史上,人工智能經(jīng)歷了三起兩落。鮑捷表示,未來30年,人工智能會(huì)也會(huì)繼續(xù)呈現(xiàn)這種上下波動(dòng)的趨勢。但是這次的熱潮肯定跟前幾次的不一樣,鮑捷給出了以下幾點(diǎn)理由:

首先,AI已經(jīng)結(jié)合很多具體場景落地到產(chǎn)業(yè)上,有些行業(yè)已經(jīng)創(chuàng)造了幾十億的產(chǎn)值;其次,從投資上看,之前的AI發(fā)展主要靠政府和軍方在做支撐,而這次資本的入駐已經(jīng)給AI的發(fā)展提供了大量的助推器;此外,工智能的發(fā)展,離不開其他技術(shù)的支持,如大數(shù)據(jù)、云。舉個(gè)簡單的例子,假設(shè)我們想造一輛車,光擁有AI這么一塊內(nèi)燃機(jī)是不夠的。云、大數(shù)據(jù)、運(yùn)維系統(tǒng),這一整套相當(dāng)于我們車的輪子,傳送機(jī)制,保險(xiǎn)機(jī)制。只有結(jié)合這些東西,才能造出一輛車,在公路上飛速馳騁。

“我們現(xiàn)在的AI就好像一個(gè)破破爛爛的車子,經(jīng)常漏氣漏油,但起碼還能用?!滨U捷笑著說道。

事實(shí)上,現(xiàn)在在人工智能領(lǐng)域已經(jīng)產(chǎn)生了一條特別長的產(chǎn)業(yè)鏈條。比如上游有上百萬的數(shù)據(jù)標(biāo)注師,下游有各種各樣的應(yīng)用場景。一個(gè)產(chǎn)業(yè)的成熟一定是建立在產(chǎn)業(yè)鏈完善的基礎(chǔ)上的。任何行業(yè)都會(huì)存在泡沫,AI繼續(xù)崩盤的情況也有可能會(huì)出現(xiàn)。但是當(dāng)浪潮退去,剩下一地雞毛后,能留下來的都是人才,都是好的企業(yè)。

現(xiàn)在很多人都認(rèn)為要實(shí)現(xiàn)AI,需要建立在先了解大腦機(jī)制的基礎(chǔ)上。鮑捷并不贊成這樣的觀點(diǎn)。舉個(gè)簡單的例子,飛機(jī)飛上天時(shí),我們還沒有空氣動(dòng)力學(xué)這樣的理論;在蒸汽機(jī)出現(xiàn)的時(shí)候,也還不存在熱力學(xué)這一理論。AI也是如此。只有當(dāng)產(chǎn)業(yè)界做出產(chǎn)品并開始盈利后,才能形成持續(xù)回饋科學(xué)的機(jī)制,帶動(dòng)學(xué)界去給我們解釋為什么,然后再靠科學(xué)帶我們沖出這片“無人區(qū)”。

“產(chǎn)業(yè)界講究成本。工程師們往往需要混合使用幾百種方法,去不斷地試錯(cuò)來完成項(xiàng)目,就像用漿糊把各種零件貼在一起一樣。在缺乏足夠理論知識(shí)下,我們今天做的事跟當(dāng)年的阿波羅登月項(xiàng)目差不多,就是要用落后的技術(shù)實(shí)現(xiàn)20年后的效果?!滨U捷說。

專訪人物

鮑捷,文因互聯(lián)CEO,聯(lián)合創(chuàng)始人。研究領(lǐng)域涉及人工智能多個(gè)方向,如自然語言處理、語義網(wǎng)、機(jī)器學(xué)習(xí)、描述邏輯、語義維基、上下文建模、語義信息論、規(guī)則語言、封閉世界推理、策略建模、語義數(shù)據(jù)集成、模塊化本體、協(xié)作本體構(gòu)建、網(wǎng)絡(luò)隱私保護(hù)、神經(jīng)網(wǎng)絡(luò)、數(shù)據(jù)挖掘和圖像識(shí)別等。在International Joint Conferences on Artificial Intelligence(IJCAI)、International Semantic Web Conference (ISWC)、Extended/European Semantic Web Conference (ESWC),和Asian Semantic Web Conference (ASWC)等期刊和會(huì)議上發(fā)表70多篇論文。曾任W3C OWL(Web本體語言)工作組成員,在此期間,合作撰寫了OWL2的W3C規(guī)范文檔。先后參與組織50多場國際學(xué)術(shù)會(huì)議和學(xué)術(shù)研討會(huì),并任中國中文信息學(xué)會(huì)語言與知識(shí)計(jì)算專業(yè)委員會(huì)委員、W3C顧問委員會(huì)委員、中國計(jì)算機(jī)協(xié)會(huì)會(huì)刊編委,中文開放知識(shí)圖譜聯(lián)盟(OpenKG)發(fā)起人之一。


相關(guān)閱讀推薦:

聚焦AI教學(xué),全球高校《人工智能導(dǎo)論》師資培訓(xùn)班召開

專訪丨南京大學(xué)高陽教授:并非取代!研究AI是為了幫助人類

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-12-25
專訪丨文因互聯(lián)CEO鮑捷:連接一切,建起金融數(shù)據(jù)的高速公路
新一代科技革命蓬勃發(fā)展,不斷催生新的產(chǎn)業(yè)形態(tài)和商業(yè)模式。金融行業(yè)在歷經(jīng)電子化、移動(dòng)化之后,也進(jìn)入了金融與科技相結(jié)合的新階段-智能金融時(shí)代。因?yàn)榕c數(shù)據(jù)高度相關(guān),金融行業(yè)一直被認(rèn)為是人工智能落地最好、最快的場景。

長按掃碼 閱讀全文