易鑫經驗:算法模型在精細化汽車金融風控中的有效運用

今年5月,易鑫集團智能數據中心算法模型團隊自主研發(fā)的“用于召回的汽車金融風控模型”(以下簡稱“召回模型”),在“首屆全球算法最佳實踐典范大賽(BPAA)”的眾多參賽作品中脫穎而出,成功入圍Top100榜單,進入金融算法賽道前二十名。

“BPAA”是由全球人工智能大會組委會主辦的年度賽事,進入TOP100的項目基本代表了國內相關領域的高端水平,將有機會獲得上海優(yōu)厚的產業(yè)支持條件。“召回模型”能夠進入該榜單,意味著易鑫長久以來在汽車金融領域的科技研發(fā)和創(chuàng)新探索獲得了積極肯定。

告別“一刀切”,“多級漏斗”的精細化風控

“召回模型”是易鑫風控“多級漏斗”體系中的模型組件之一,在精細化評估客戶違約風險,發(fā)掘潛在客戶方面發(fā)揮著重要作用。

追求客戶增長的同時還要努力降低客戶違約風險,這個看似矛盾的需求一直交織在汽車金融業(yè)務開展的過程中,兩者只能通過企業(yè)有效的風控管理達到動態(tài)平衡。因此,一家汽車金融企業(yè)的風控管理水平,直接關系著業(yè)務增長的“質”與“量”。

易鑫經驗:算法模型在精細化汽車金融風控中的有效運用

易鑫算法模型團隊在同領導研討“多級漏斗”模型

“傳統(tǒng)風控手段簡單直接,僅僅依靠歷史業(yè)務經驗‘一刀切’。”易鑫風險管理部負責人施晴說:“這種‘單漏斗’模式會將大量潛在客戶擋在門外,無形中還可能增加交易風險。”數據分析表明,一次評估過程往往不能對客戶的風險程度做出精準的預測。對于易鑫而言,要在汽車金融這個競爭激烈的市場盤子中,爭取服務更多資質合格的購車用戶,就要對公司的風控體系做出更精細化的建設。在風控業(yè)務部門協(xié)助下,算法團隊經過一年的設計檢驗,終于設計出“多級漏斗”的風控體系。

“多級漏斗”其實是一個客戶分層評估結構,它將風控審核分為預審、審核、復審三個環(huán)節(jié)。在預審階段,用預審機器人粗框架的排除明顯“不合格”的客戶;在審核階段,主審機器人將客戶分為“可服務”和“擬拒絕”兩種類型;之后,兩種類型的客戶都會進入復審程序,兩個不同“偏好”的機器人會分別對上述兩類客戶進行評估:“可服務”類型通過“糾錯機器人”判斷其違約可能性,“擬拒絕”通過“召回機器人”判斷其履約可能性。就這樣,“多級漏斗”對同一客戶進行多重評估,并根據最終得分預測客戶的履約行為。

“行業(yè)里傳統(tǒng)的做法,會直接剔除‘擬拒絕’的客戶。而易鑫的評估體系內,我們在定義客戶前增加了一層機器人組合的布局,通過算法來預測客戶的履約行為。”模型算法組負責人袁芃說:“通過‘多級漏斗’中四個機器人組成的矩陣反復評估,易鑫風控能盡量做到既不錯失一個“好”客戶,也不讓一個高風險客戶成為漏網之魚。”

效果顯而易見,易鑫自創(chuàng)的召回模型每月能從“擬拒絕”清單中發(fā)掘數百個客戶。經過長期的跟蹤統(tǒng)計,這批客戶的履約表現(xiàn)要高于公司的整體客戶水平。

被數據“馴化”的算法模型

“組成‘多級漏斗’的機器人矩陣,其實質是一個個算法模型。模型的形成是被數據‘馴化’的過程。”算法構架工程蘇乾負責模型搭建。他介紹說,首先,要從200多萬既有客戶的700多個特征維度中甄選出300多個特征組成特征庫;再根據標簽規(guī)則,對篩選出的客戶樣本進行逐一標記,生成訓練樣本;將訓練樣本輸入機器學習模型進行訓練,再通過歷史數據進行驗證,根據驗證結果計算出合理模型。這些模型都需要在多級漏斗體系內反復迭代訓練,在相同的驗證數據集上進行模擬比對,才能得出最優(yōu)的模型。

袁芃認為這個過程就像是組建一支軍隊:篩選出的客戶特征就是武器,按照不同的任務類型(標簽),將武器裝備訓練成相應的兵種(模型),多兵種有機結合構建全方位、立體式的戰(zhàn)斗矩陣(風控方案)。就像軍隊作戰(zhàn)需要隨機應變一樣,模型搭配組合也會根據訂單情況和公司業(yè)務發(fā)展規(guī)劃進行調整。“這樣,就構成了易鑫智能化風控管理的‘兵法’”。

易鑫經驗:算法模型在精細化汽車金融風控中的有效運用

易鑫算法模型團隊在討論“召回模型”運行原理

“兵法”的煉成自有難點,其中最關鍵的兩個,一是找到合適的樣本,二是對容錯的精準控制。

“召回模型是對‘擬拒絕’的客戶進行風險評估,需要有這類客戶的訓練樣本來訓練模型,而這類樣本是沒有標簽的。”蘇乾說,系統(tǒng)歷史訂單中只有已成交客戶的樣本標簽,如果只使用已成交客戶樣本來訓練模型,會存在樣本偏差,無法對全量客戶進行精準預測。“就像‘優(yōu)中選優(yōu)’只會提高客戶審核通過的門檻”。他舉了一個例子,班主任要幫成績差的學生補課,可是他只收集優(yōu)秀學生的意見,再去給成績差的學生講解,只能是無功而返。

對此,蘇乾和同事許博在采用算法界通用的拒絕推斷技術基礎上,創(chuàng)新設計了一套“A&B表”的樣本反復輪番訓練法。這個方式是將成交客戶不良標簽的統(tǒng)計表A和“擬拒絕”客戶相應標簽的統(tǒng)計表B,按照算法生成新的統(tǒng)計表A1,再把統(tǒng)計表A1和統(tǒng)計表B用算法再次得出A2、A3……到An,如此循環(huán)往復以糾正偏差,最終根據各個版本A表的模擬測試結果,得出最優(yōu)方案。

容錯控制則更為曲折。團隊最開始采用逾期率控制的方式倒推可容錯的客戶量,試行后發(fā)現(xiàn)精確度不夠;后來經過反復測試,決定采用定量成交后的樣本觀測法,這才得到了想要的效果。”

“制定一個算法邏輯只是數學公式,驗證數學公式則需要大量的案例。” 易鑫技術副總裁張磊說:“易鑫‘智能數倉’將客戶履約行為,通過加密脫敏處理成標準樣本,為優(yōu)化模型提供了最好的訓練素材。”

VESTA模型訓練平臺,人人皆可參與

傳統(tǒng)模型構建方法有技術門檻,只能由專業(yè)從事算法的技術工程師操作。過去,團隊經常收到業(yè)務端一些特殊的標簽要求,比如“畢業(yè)院校”、“主修專業(yè)”等特征加到模型里。“之前覺得沒意義,但離客戶最近的是業(yè)務人員,他們真實了解每一個標簽的意義,采納他們意見建立的特征庫就會更鮮活。”蘇乾說。

一個大膽的想法由此萌發(fā):構建一個低門檻的平臺,讓不懂算法的業(yè)務人員參與進來,一起在實操中訓練模型。VESTA正是在這個環(huán)境中誕生的開放平臺。在VESTA,一個完全不懂算法知識的業(yè)務人員,通過簡單的操作培訓,就可以構建訓練模型。易鑫風控策略部的陳慶玲是第一個吃螃蟹的人。“之前,我們擔心將一個變量審核通過率提高會增大風險,通過實際結果觀察發(fā)現(xiàn)是沒有問題的。”她在VESTA平臺上將模型和策略結合使用,針對不同客戶、業(yè)務添加有效變量,通過模型數據的跟蹤分析,成功地驗證了提升某變量5個百分點的合理性,并最終應用到了模型中。

在袁芃的設想中,VESTA平臺可以簡化訓練模型的復雜程度,吸收更多的業(yè)務人員加入到模型訓練中。由此,可充分發(fā)揮業(yè)務人員的優(yōu)勢,深入結合業(yè)務經驗與算法模型,快速將算法模型滲透到業(yè)務各個環(huán)節(jié)中,從而實現(xiàn)更精準高效的風險控制。

“風險管理是汽車金融業(yè)務中的核心關鍵環(huán)節(jié)。傳統(tǒng)‘一刀切’的經驗主義已不能適應業(yè)務快速增長的需求。”張磊說:“市場競爭加劇,在服務更多客戶和保證資產質量的雙重要求下,技術探索還會繼續(xù)。用算法技術武裝業(yè)務工具,是個不可逆轉的趨勢。”

據悉,作為易鑫用科技化手段重構汽車金融業(yè)務的一個“代表作”,“召回模型”已經在申請專利。未來,這家專業(yè)的汽車金融交易平臺還在繼續(xù)探索更多的業(yè)務應用方案,努力朝著業(yè)務全智能化的方向邁進。

(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )