「經常有人問我,AI 的未來是什么?你對未來有著怎樣的展望?我通常會說,那些金融科技公司所處的生態(tài)領域內的發(fā)展,將是未來AI最有意思的地方?!箼C器學習領域的泰斗級學者、螞蟻金服科學智囊團主席、加州大學伯克利分校教授 Michael I. Jordan 說。
確實如此,這些公司所面臨的是真正意義上的行業(yè)難題,而它們就是 AI 應用最為有效的地方?!肝覀冮_始發(fā)現(xiàn),AI 不再是簡單的想要模仿人類的智能,而是成為了一種新的能力。它像水一樣滲透在社會經濟的每一個角落,散發(fā)智能、解決問題?!刮浵伣鸱?CTO 程立解釋道,
「基于這樣的 AI 所釋放出來的能力,不僅可以幫助人們更加深刻地洞察社會,在金融領域更好地發(fā)現(xiàn)和控制風險,也能夠為每一個普通人打造一個貼心的生活助理和財富顧問,讓每一個小微企業(yè)擁有最智慧的經營助手和最優(yōu)秀的 CFO?!?/p>
4 月 25 日,ATEC 螞蟻開發(fā)者大賽人工智能大賽啟動,主辦方螞蟻金服發(fā)起初衷就是要把業(yè)務體系中最又價值的問題提煉出來,并提供自主可控的 AI 平臺,分享給開發(fā)者用創(chuàng)新技術方案去解決。
「事實上,AI 是一個工程學科,有時候大家覺得 AI 是神奇魔幻的工具,把它引入公司就會帶來奇跡,其實這是不對的?!筂ichael I. Jordan 說道,「AI 是由工程師的大腦打造出來的一種解決問題的手段,是一種思考解決問題手段的方法。今天我們舉行的大賽就是一個非常好的例子,大家可以去思考怎么樣用工程師的頭腦解決問題,而不是用魔術的手段帶來奇跡?!?/p>
某種程度上,對這些參賽選手而言,與其說是參與一次比賽,更像是在一家科技金融公司完成一個個真實項目。我們在現(xiàn)場深度了解了圍繞具體金融業(yè)務場景的賽題,并從專家們的介紹中找到了一些解題方向。
一、支付風險識別
第一道賽題是一個有關支付風險識別的問題。
基于移動互聯(lián)網的新金融業(yè)務在蓬勃發(fā)展的同時,黑產攻擊的能力也在不斷升級。信息泄露是導致帳戶安全最為嚴重的問題之一。國際上多起用戶信息泄露的事件,過億的敏感數(shù)據(jù)被盜用、利用,給用戶和銀行帶來了巨大的經濟損失。
保護消費者和風險識別,也越來越成為金融行業(yè)和學術界關注的焦點。以這個研究點出發(fā),螞蟻金服以高度模擬真實業(yè)務的數(shù)據(jù)和場景,希望行業(yè)大咖一起對風險模式、無標簽數(shù)據(jù)的學習這兩個技術難題做出深入的研究和突破,為金融風控行業(yè)帶來價值的同時推動人工智能下一步的發(fā)展。
「過去四十年,這一直都是很大的問題,而且現(xiàn)在還沒有解決。 90 年代,有一些銀行開始用機器學習做檢測,而且結果不錯。亞馬遜在線上使用之后,我們可以看到虛假支付的比例升高,他們用機器學習手段把虛假支付率降低了很多?!筂ichael I. Jordan說道。
在活動現(xiàn)場,螞蟻金服副總裁、大安全負責人芮雄文介紹了這道賽題的背景——
支付寶是螞蟻金服的起源,而移動支付之所以在中國普及的根本原因在于,相較于信用卡,基于二維碼的移動支付上根本降低了消費者和商戶的支付門檻,而且與 POS 機比起來,成本更低。
在便捷、低成本的基礎上,安全就成為了螞蟻金服要面臨的首要問題,這也是所有金融服務的基石。
在安全科技方面,螞蟻金服擁有三大核心能力,分別為確保線上線下環(huán)境中操作者即賬戶擁有者本人的數(shù)字身份;運用大數(shù)據(jù)、機器學習和人工智能實現(xiàn)精準識別和防控風險的智能風控大腦;以及免于內外遭受攻擊的數(shù)據(jù)保護及隱私。
芮雄文還特別提到了螞蟻金服在智能風控方面的最新探索——AlphaRisk 風控引擎。
這套引擎擁有四個核心系統(tǒng),包括風險感知(感知風險形勢和情境)、風險識別(毫米級精準識別所有風險)、自動駕駛(基于風險場景和用戶狀態(tài)完成個性化智能推薦的管理措施)、以及自我學習能力(在黑產不停變化的同時保證整個風控系統(tǒng)能夠自動學習、更新)。
在這套風控引擎的支持下,目前螞蟻金服的資損率已經小于百萬分之一,每秒可以在峰值時處理超過 50 萬筆的風險交易,還可以在 1 秒內更換整個策略體系。
不過,智能風控領域仍然存在一些難以攻克的挑戰(zhàn)。芮雄文舉了兩個例子,一是黑產作案手段不斷變化,傳統(tǒng)的攻防模型過幾天效果就會下降;二是缺乏黑樣本的情況下讓模型精準識別。
對此,東華大學校長、原同濟大學副校長蔣昌俊也分享了他的觀點:
「早期使用的規(guī)則系統(tǒng)產品性、針對性強,但適應性、演化性弱。但騙子不可能拿著一招騙術一勞永逸下去,肯定會更新,這個時候規(guī)則系統(tǒng)難以適應,所以需要模型和算法來解決這個問題?!?/p>
然而,模型和算法是抽取出來一個數(shù)學處理方式,其場景性已經沒有那么強。在這個過程中,如何把規(guī)則的、場景性的特征針對性地融合到模型和算法中,讓模型和算法適應整個場景,才會提高系統(tǒng)的時效性和穩(wěn)定性。
「這是需要賽手們發(fā)揮智慧的地方。」蔣昌俊說道,
「另外就是黑樣本和正常樣本數(shù)量嚴重不對稱的問題。一般來說,兩個樣本在差不多情況下建立的模型會比較好,而在嚴重不對稱的情況下,怎么還能夠達到這個效果?這就是這個風控問題的第二個難點,做好了也是這個問題的亮點。我覺得這是關于智能風控的問題上需要大家去創(chuàng)新、去創(chuàng)造的地方?!?/p>
二、智能金融客服
第二道賽題則與智能客服相關。普惠金融的重要目標就是給廣大用戶提供高效和個性化的客戶服務體驗,以人工智能技術為核心的智能客服在提升用戶體驗方面扮演了重要角色。
而智能客服的本質,就是充分理解用戶的意圖,在知識庫中精準地找到與之相匹配的知識點,從而回答用戶問題或提供解決方案。整個智能客服都是圍繞著用戶問題而構建,問題相似度計算則是貫穿智能客服知識庫建設、在線問題匹配,全鏈路數(shù)據(jù)化運營等幾乎所有環(huán)節(jié)最核心的技術,這項技術的發(fā)展及其相關數(shù)據(jù)的建設,勢必會促進整個客服行業(yè)的進步。
「在金融領域,挑戰(zhàn)本身是非常廣泛的,來自很多方面。」螞蟻金服副總裁、首席數(shù)據(jù)科學家漆遠說道,「為了解決這些問題,我們開發(fā)了一系列人工智能算法?!?/p>
而在開發(fā)算法的核心,也就是打造人工智能引擎的過程中,螞蟻金服也遇到了很多挑戰(zhàn),例如使機器學習引擎能夠快速的再判斷、如何面對非常小的樣本實現(xiàn)學習和預測等。
「我們在這里做的第一個工作就是在智能客服上面,希望通過多輪對話的能力使支付寶更加智能,可以理解對話背后的意義?!蛊徇h補充道。
螞蟻金服資深算法專家張家興進行賽題闡述時說,「這個賽題說起來它的定義非常簡單,就是給你兩句話,讓你判斷這兩句話說的語義是不是一致的。比如一句話是『花唄怎么還款』,另外一句話是『花唄如何還錢』。這兩個句子有很多字不一樣,但是有相同的意思?!?/p>
這在智能客服中的意義是非常重大,但背后并不簡單。
首先,客服最重要的一點就是理解用戶的意圖,然后在知識庫中匹配相關的知識點。目前工業(yè)界最主流的匹配做法就是把用戶的問題與知識庫中所有的問題逐一進行相似度計算,把相似度最高的問題作為用戶的意圖,再把它的答案返還給用戶。
除此之外,相似度計算對整個客服的各個方面也都具有意義。例如,知識庫其實是用是基于文本的自動挖掘而來,這個文本的自動挖掘算法也要基于計算任意兩個文本之間的相似度,或者高維空間二者之間的距離。
在數(shù)據(jù)化運營的各個環(huán)節(jié),還有包括搜索推薦、對話等其他領域,相似度計算也都是非常核心、基礎的問題。
而眼下,NLP 相似度計算所面臨最大挑戰(zhàn)和問題恰恰是在于,智能客服里面存在大量的非常多樣性的問題,包括各地的方言、口語以及各種表達方式等方面的不同,對問題的匹配提出相當高的要求。但 NLP 的進展主要集中體現(xiàn)在情感分析和翻譯方面,在這些場景下,大多情況下是在一個比較固定的數(shù)據(jù)集,可以在比較簡單干凈的數(shù)據(jù)集上得到很好的結果。
「這里的挑戰(zhàn)其實也很簡單,就是因為人的在他表達相同意思的時候,可能性太多了,有各種各樣不同的說法?!箯埣遗d還給出了自己的解題想法:
一是關注問題的表達以及不同層次的表達。人們所看到的自然語言本身也是一種表達形式,在這個基礎上可以做很多事情。例如,基于深度學習模型把句子變成一個向量,計算向量之間的距離;也可以通過依存分析,把句子建立一個語法樹,在樹的層次上建立模型匹配;或者可以把句子真正理解到語義層次,這樣一來,把任何兩個句子的語義做一個匹配可能會達到更好的效果。這都是實踐中的嘗試,希望大家也可以嘗試出更多的道路。
第二點在于,機器學習依賴大數(shù)據(jù),這道賽題給的是客服領域的數(shù)據(jù),希望大家可以探索更多領域的數(shù)據(jù),用一些機器學習方法把其他領域學到的東西結合客服領域的數(shù)據(jù)上來,最終達到更好的效果。
事實上,無論是黑產的變化多端導致的樣本信息不對稱,還是因為客服數(shù)據(jù)多樣性造成的模型弱適應性,這些問題都要解決“小數(shù)據(jù)”問題。我們理論上常說如果有了大數(shù)據(jù)就能怎樣怎樣,但實際工程化過程中都很難達到如此理想的環(huán)境。無論是遷移學習,還是無監(jiān)督學習,如何用較少的樣本來達到更高的精度,更快速的識別率,提升機器學習泛化能力,都是下一階段極具挑戰(zhàn)性的課題。
這一系列命題,部分構成了新金融領域當下最需要解決的難題。
微信端:*點擊閱讀原文,立刻登錄大賽官網進行報名參賽,百萬獎金等你來戰(zhàn)。
其他渠道:*立刻登錄大賽官網,進行報名參賽,百萬獎金等你來戰(zhàn)。
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- 為什么年輕人不愛換手機了
- 柔宇科技未履行金額近億元被曝已6個月發(fā)不出工資
- 柔宇科技被曝已6個月發(fā)不出工資 公司回應欠薪有補償方案
- 第六座“綠動未來”環(huán)保公益圖書館落地貴州山區(qū)小學
- 窺見“新紀元”,2021元宇宙產業(yè)發(fā)展高峰論壇“廣州啟幕”
- 以人為本,景悅科技解讀智慧城市發(fā)展新理念
- 紐迪瑞科技/NDT賦能黑鯊4 Pro游戲手機打造全新一代屏幕壓感
- 清潔家電新老玩家市場定位清晰,攜手共進,核心技術決定未來
- 新思科技與芯耀輝在IP產品領域達成戰(zhàn)略合作伙伴關系
- 芯耀輝加速全球化部署,任命原Intel高管出任全球總裁
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。