近日,中國人民銀行發(fā)布金融行業(yè)標(biāo)準(zhǔn)《人工智能算法金融應(yīng)用評價規(guī)范》,發(fā)布之日起正式實施。索信達(dá)控股有限公司(索信達(dá)控股,股票代碼:03680.HK)作為金融行業(yè)大數(shù)據(jù)與人工智能解決方案提供商,早在“規(guī)范”實施前,于2019年面向國內(nèi)金融行業(yè)率先推出應(yīng)對AI算法可解釋性的“模型翻譯機-可解釋機器學(xué)習(xí)”,并已在金融機構(gòu)成功落地應(yīng)用。應(yīng)對AI算法精確性、性能和安全性推出“模型工廠”、“模型管理平臺”等全棧解決方案,索信達(dá)成為推動人工智能算法金融應(yīng)用規(guī)范管理的先行者。

據(jù)悉,《規(guī)范》針對當(dāng)前金融行業(yè)人工智能技術(shù)應(yīng)用存在的算法黑箱、算法同質(zhì)化、模型缺陷等潛在風(fēng)險問題,建立了人工智能金融應(yīng)用算法評價框架,從安全性、可解釋性、精準(zhǔn)性和性能等方面系統(tǒng)化地提出基本要求、評價方法和判定準(zhǔn)則,為金融機構(gòu)加強智能算法應(yīng)用風(fēng)險管理提供指引。
《規(guī)范》指出,AI算法精準(zhǔn)性和性能是計價算法應(yīng)用效果及目標(biāo)的主要因素,一般而言精準(zhǔn)性和性能越高算法應(yīng)用效果越好。算法可解釋性是判斷算法是否適用的重要依據(jù),可解釋性越高,算法內(nèi)在邏輯、技術(shù)實現(xiàn)路徑、決策過程、預(yù)期目標(biāo)越明晰,算法更易于被理解、匹配、應(yīng)用和管理。AI算法安全性為算法在金融行業(yè)應(yīng)用提供安全保障,是決定AI算法是否可用的基礎(chǔ),只有在滿足安全性要求的前提下,才能在金融領(lǐng)域開展應(yīng)用。
就人工智能算法和技術(shù)如何融入到銀行的日常應(yīng)用規(guī)范管理和業(yè)務(wù)中,索信達(dá)控股首席科學(xué)家張磊博士總結(jié)為“四大能力、八類應(yīng)用”,并介紹了索信達(dá)在銀行業(yè)的實際的AI應(yīng)用案例。
助力銀行業(yè)發(fā)展的人工智能四大能力
人工智能這個話題很火,如何和銀行業(yè)務(wù)需求打通,把人工智能技術(shù)移駕到銀行業(yè)本身,這是很多銀行客戶都很關(guān)心的問題。以下是張磊博士基于索信達(dá)客戶最佳實踐,總結(jié)構(gòu)建自身人工智能能力的“四大能力”:

第一,業(yè)務(wù)能力:以業(yè)務(wù)能力為出發(fā)點,所有技術(shù)都要解決業(yè)績問題。索信達(dá)已梳理出金融行業(yè)可以用AI解決的業(yè)務(wù)問題,如市場營銷、風(fēng)險管控、財務(wù)人事、運營績效相關(guān)的,針對問題進行歸類就可以圈出銀行業(yè)用人工智能數(shù)據(jù)分析解決問題的范圍。
第二,數(shù)據(jù)能力:以數(shù)據(jù)為基礎(chǔ),各種數(shù)據(jù)加工能力為手段,將數(shù)據(jù)利用起來。人工智能技術(shù)和其他的技術(shù)有一些不同,它完全依賴數(shù)據(jù),若無數(shù)據(jù)支撐所有先進算法都無作用,所以要有數(shù)據(jù)儲存、加工的能力。
第三,分析能力:以各種先進算法為工具,發(fā)現(xiàn)數(shù)據(jù)中蘊含的有價值的規(guī)律。算法的類型像可解釋機器學(xué)習(xí)、自然語言處理、圖分析、圖計算等,這些算法目前在金融領(lǐng)域用的比較多。
第四,思維能力:索信達(dá)幫助企業(yè)構(gòu)建分析思維能力,更加合理有效地發(fā)現(xiàn)和解決問題。這點要特別強調(diào)!因為總被忽視,很多人掌握了技術(shù)也知道業(yè)務(wù)能力,但是還是解決不了問題,因為缺少思維能力。如何將梳理好的數(shù)據(jù)、算法、業(yè)務(wù)問題貫通起來,這就需要分析思維能力。
銀行業(yè)務(wù)問題的分類體系與AI技術(shù)的對應(yīng)關(guān)系
銀行業(yè)面臨的業(yè)務(wù)問題主要分八大類:
分類問題,將輸入樣本分類到對應(yīng)類別中。判斷客戶質(zhì)量,購買意愿。
估值問題,根據(jù)輸入信息估算某個指標(biāo)的數(shù)值。如,某家分行下個月存款余額會到多少?
聚類問題,根據(jù)實例的相似度進行歸類,銀行有上億客戶,想將其分成不同的客戶客群,還有網(wǎng)點、支行等的分行也是聚類問題。
優(yōu)化問題,基于目標(biāo)函數(shù)和約束條件生成最優(yōu)解。如,我有預(yù)算100萬如何將其花出去達(dá)到最大效益?
異常偵測,發(fā)現(xiàn)異于常規(guī)的實例。如,一筆金融交易是否有問題,是否是欺詐交易,賬戶間互相的聯(lián)動是否是洗錢聯(lián)動。
評級問題,對實例進行排序評級,像信用評級是標(biāo)準(zhǔn)問題。
推薦系統(tǒng),生成下一步的最佳行動建議。
數(shù)據(jù)生成,基于已有的數(shù)據(jù)分布仿真出類似數(shù)據(jù)。
通過調(diào)研可以清楚看到,八類問題的重要程度和價值回報也各有不同。
銀行業(yè)使用的重點分析技術(shù)
銀行業(yè)會用到很多分析算法,最常用的重點技術(shù)包括:隨機森林、前饋神經(jīng)網(wǎng)絡(luò)、回歸分析、分類器、聚類、統(tǒng)計推斷、循環(huán)神經(jīng)網(wǎng)絡(luò)、強化學(xué)習(xí)。圖中越深的顏色代表使用頻率較高。

分析專題和數(shù)據(jù)類型有一定的對應(yīng)關(guān)系,張磊博士認(rèn)為,無論是做潛客獲取或是智能客服或反欺詐、現(xiàn)金庫存優(yōu)化等都是人工智能可以大顯身手的領(lǐng)域。
在銀行業(yè),AI應(yīng)用需要重點關(guān)注回報最大的業(yè)務(wù)領(lǐng)域
對于銀行業(yè)來說,AI應(yīng)用需要重點關(guān)注回報最大的業(yè)務(wù)領(lǐng)域。盲目地做人臉識別或文檔OCR等無法帶來明顯的業(yè)務(wù)價值。其中獲得回報最大的是市場營銷,其次是風(fēng)險管控。

建立模型工廠,打造五庫合一的分析模型生產(chǎn)流水線
索信達(dá)打造五庫合一的分析模型生產(chǎn)流水線,通過模型工廠,幫助企業(yè)進行數(shù)據(jù)分析建模的現(xiàn)代化生產(chǎn)流水線。它融合了分析建模生產(chǎn)所需的全部裝備,做到五庫合一:模型庫、模板庫、代碼庫、知識庫、課件庫。只需裝填數(shù)據(jù)原材料,即可自動化生產(chǎn)出可用的標(biāo)準(zhǔn)模型,同時支持個性化定制。
索信達(dá)將八大類問題梳理了50多個專題,通過大量實踐發(fā)現(xiàn)它成型的套路,比如要做資產(chǎn)提升大概分為7個步驟可以分析出來,要做反欺詐可以做9個步驟分析出來,索信達(dá)希望通過構(gòu)建金融業(yè)的模型工廠,把銀行遇到的每個問題都可以標(biāo)準(zhǔn)化自動化解決。

打造模型管理平臺 全局掌控企業(yè)模型管理
隨著大數(shù)據(jù)和分析算法的蓬勃發(fā)展,金融機構(gòu)在營銷管理、風(fēng)險管理和決策支持的過程中,研發(fā)了大量模型來支持企業(yè)的運營與管理。但由于模型數(shù)量眾多,模型管理的問題隨之而來。索信達(dá)控股基于多年來在金融行業(yè)大數(shù)據(jù)領(lǐng)域的技術(shù)沉淀及經(jīng)驗,率先業(yè)界發(fā)布了模型管理系統(tǒng)。對企業(yè)級投產(chǎn)上線的模型進行評有效的評估、測試、監(jiān)控以及版本和權(quán)限管理。助力金融機構(gòu)搭建完善的模型管理系統(tǒng),大幅提升企業(yè)統(tǒng)籌管理及運行模型的效率。

模型管理系統(tǒng)以自動化的方式計算各種評估指標(biāo),根據(jù)模型衰退和數(shù)據(jù)變化自動預(yù)警。通過監(jiān)控模型的定時驗證數(shù)據(jù),可在系統(tǒng)每執(zhí)行一次模型的定時任務(wù)后,在模型詳情頁中查看驗證后的指標(biāo)值數(shù)據(jù)和對應(yīng)的圖表數(shù)據(jù)。如果驗證失敗,則本系統(tǒng)不會生成模型的指標(biāo)值,且在首頁的“事件消息”模塊中會顯示該模型定時任務(wù)運行失敗的消息。
索信達(dá)模型管理系統(tǒng)有效地解決金融機構(gòu)等企業(yè)模型管理的痛點,大幅度降低模型失控、模型資產(chǎn)管理混亂和依靠人工操作所帶來的風(fēng)險。打造出企業(yè)級自動化模型工廠,全方位、自動化、標(biāo)準(zhǔn)化地掌控企業(yè)模型管理。
模型翻譯機 可解釋機器學(xué)習(xí)
索信達(dá)控股率先業(yè)界發(fā)布推出的可解釋機器學(xué)習(xí),是金融行業(yè)企業(yè)級數(shù)據(jù)挖掘方案。該方案通過融合多種模型和算法,致力于解決銀行金融機構(gòu)現(xiàn)有機器學(xué)習(xí)模型“黑箱”的問題,幫助銀行提升模型透明度,滿足監(jiān)管需要,同時增強模型精度和決策的可靠程度。保證模型高精度條件下,針對客戶不同應(yīng)用場景均能做出深度解釋,幫助客戶降低模型風(fēng)險合規(guī)風(fēng)險
據(jù)張磊博士介紹,⽬前已在產(chǎn)品精準(zhǔn)推薦、客戶挖掘、流失預(yù)警等多個⾦融類營銷場景中開展應(yīng)⽤和落地,并取得了優(yōu)秀的成果,使得⼈⼯智能算法和技術(shù)能夠更好的融入到銀行的日常應(yīng)用規(guī)范管理和業(yè)務(wù)中。
12步搭建客戶微細(xì)分模型,客戶名單命中率最高可提升75%!
索信達(dá)通過將結(jié)構(gòu)化數(shù)據(jù)進行合理的圖像化,并創(chuàng)新地運用深度學(xué)習(xí)算法,挖掘反映客戶資產(chǎn)偏好的深層特征,從而有效提升銀行現(xiàn)有各個模型的準(zhǔn)確性,并通過客戶在不同圖像狀態(tài)之間的轉(zhuǎn)移概率,預(yù)判出客戶資產(chǎn)配置的發(fā)展趨勢,為一線客戶經(jīng)理提供覆蓋全客戶的營銷方向。
通過引入索信達(dá)客戶微細(xì)分產(chǎn)生的新圖像特征,將上線模型(大額存單、結(jié)構(gòu)性存款)前10%名單的命中率提高20%~40%;無論采用何種預(yù)測算法,模型均有明顯提升,前5%名單的命中率最高提升3/4;直接產(chǎn)生的營銷效益高達(dá)數(shù)百萬至上千萬。
基于深度學(xué)習(xí)的客戶微細(xì)分分析建模流程

客戶微細(xì)分,是運用算法把客戶數(shù)據(jù)變成圖像,以更加細(xì)致、更加創(chuàng)新的模型為客戶精準(zhǔn)畫像,給銀行業(yè)務(wù)的開展帶來更有價值的決策依據(jù)。索信達(dá)客戶微細(xì)分的全部流程分為12個步驟,這是個思考、模擬、反復(fù)驗證的過程,很是有趣。
第一,以數(shù)據(jù)圖像化為橋梁
人工智能近年來比較火的是深度學(xué)習(xí),但深度學(xué)習(xí)算法主要是做圖像識別,適合處理圖像,而銀行基本上都是結(jié)構(gòu)化數(shù)據(jù),例如賬戶數(shù)據(jù)、交易數(shù)據(jù)等,結(jié)構(gòu)化數(shù)據(jù)無法直接被深度學(xué)習(xí)算法所用,需要借助數(shù)據(jù)圖像化,把結(jié)構(gòu)化數(shù)據(jù)變成合理的圖像就可以用到這個技術(shù)了。
第二,客戶的產(chǎn)品資產(chǎn)結(jié)構(gòu)化數(shù)據(jù)
先來看銀行最典型的數(shù)據(jù),比如我們拿到了500萬富裕零售客戶過去12個月的數(shù)據(jù),AUM月日均超過5萬以上,數(shù)據(jù)量是每月500萬客戶,包含的字段信息有AUM、活存余額、定存余額、基金余額、理財余額等。
第三,數(shù)據(jù)標(biāo)準(zhǔn)化與離散分箱
下圖列出5條客戶數(shù)據(jù),每位客戶給出了各項產(chǎn)品的余額。比如第一個客戶活存11.8萬,定存只有1767元,這是銀行常見的數(shù)據(jù),數(shù)據(jù)拿來后會先做標(biāo)準(zhǔn)化,因為一個客戶活存余額有10萬并不一定代表這個客戶喜歡活存,如果他的資產(chǎn)有1000萬,把900多萬放在定存10萬放在活存,顯然不能說明他喜歡活存。


第四,相關(guān)分析
接下來我們希望將這個數(shù)據(jù)變成一幅圖,才能使用圖像識別技術(shù)。這個數(shù)據(jù)可以變成瓦片圖,按照比例高低,最高的放在最左邊,但是瓦片圖最大的問題是沒有考慮產(chǎn)品之間的關(guān)系,只是簡單按照數(shù)字大小排。如何把產(chǎn)品之間的關(guān)系引用進來呢?比如說理財和基金是不是有互斥的關(guān)系。通過相關(guān)分析,就可以看出變量之間的相關(guān)性是正相關(guān)、負(fù)相關(guān),哪些相關(guān)系數(shù)強或弱。
第五,太陽系與萬有引力定律
算出相關(guān)系數(shù)之后,再來看如何改造前面得到的“瓦片圖”。張磊博士聯(lián)想到太陽系九大行星,地球、金星、火星圍繞太陽轉(zhuǎn),這之間的軌道不是很快形成的而是慢慢形成的,是星球間的萬有引力才使其形成的,所以運用這種“引力”定位行星的運行軌道。我們只需將活存、定存、國債、基金、理財這些產(chǎn)品視作星球,將彼此間的相關(guān)系數(shù)視作引力,就可以通過迭代來構(gòu)造出產(chǎn)品的星系圖。
第六,網(wǎng)絡(luò)布局算法與斥力模型
運用斥力算法,把一堆產(chǎn)品想象成一堆球丟在桌上,相互之間會有引力斥力,當(dāng)斥力達(dá)到平衡時得到最終結(jié)果。活存和理財離的比較近代表比較相關(guān),貴金屬離的比較遠(yuǎn),則相當(dāng)于很遙遠(yuǎn)的冥王星。現(xiàn)在可以發(fā)現(xiàn)我們已經(jīng)將剛才的數(shù)據(jù)變成更有意義的圖像了,但這個時候還不適合做深度學(xué)習(xí)。如果現(xiàn)在是把100張這樣的圖擺在你面前,你一定會看的眼花繚亂,但是如果把瓶子或椅子放在這里,離100米就能看出大概什么區(qū)別,是因為從其輪廓上很自然就能識別出來。目前的圖像還沒有鮮明的輪廓,所以需要對這些圖進行改造。


第七,等高線投影與顏色映射
可以把這些小球想象成一個個山頭,可以看到這些山頭高高低低的,高高低低的山峰如果想畫到二維上通常會用等高線,于是把一堆球變成一堆山峰,再變成一些二維等高線,就得到最開始我展示的那張圖。中間最紅最亮的就是客戶最關(guān)心的產(chǎn)品如活存、理財、定存。


第八,一人一圖像百花齊放
下面羅列了20張圖,有一些圖比較類似,比如說倒數(shù)第二列第一行第二行,像兩塊石頭堆在一起。有的客戶很不一樣,有的客戶很類似。例如,左上角這個客戶只有一塊亮就是定期存款,右下角這個客戶是重財惜命型,他的資產(chǎn)主要放在人身險和財產(chǎn)險;還有的客戶是惜命愛基型,財產(chǎn)放在人身險和基金;再是貸款型以貸款為主,少量活存,大量資產(chǎn)放在貸款,另外有一定的活期存款用來還款;還有白領(lǐng)型,活存和薪金煲為主,其次是人身險,該客戶是標(biāo)準(zhǔn)的代發(fā)工資客戶,工資發(fā)下來后會買薪金煲,同時還會買基金,收入應(yīng)該不會太低,還會買人身險。什么樣的代發(fā)工資客戶在這家工資用信用工資做理財還買人身險,通常來說收入水平會達(dá)到一定水平。


第九,圖像的自動特征編碼
很多圖做出來發(fā)現(xiàn)比較類似,所以很自然會想到把類似的圖像聚類在一起。圖像聚類通常會采用自動編碼器,算法的輸入是這張圖像,輸出還是這張圖像,中間做壓縮編碼和解碼,用幾個數(shù)字來表示這張圖像的主要特征。
第十,密度聚類為客戶微狀態(tài)
把圖像變成數(shù)字特征后就可以采用聚類算法進行聚類,把類似的圖像聚到一起,最開始索信達(dá)采用的是AP算法,但是效果太慢,后來又換成了密度聚類算法,原來跑的AP算法大概跑40多分鐘,但是換了DBSCAN算法只需要6秒,把類似的圖放在一起,就聚成了1616個個類。
第十一,狀態(tài)隨時間的轉(zhuǎn)移概率
索信達(dá)發(fā)現(xiàn)聚類效果還不錯,類中心的代表性比較強,由此就得到了1616個微細(xì)分群。如果把每一個微細(xì)分群看成一個狀態(tài),可以發(fā)現(xiàn)每個月客戶的狀態(tài)在不斷地變,大部分時候變的很慢,從一張圖變成另一張圖有業(yè)務(wù)的含義,先是日常消費,然后嘗試買理財,然后申購基金辦理理財卡。
第十二,狀態(tài)轉(zhuǎn)移全景圖
索信達(dá)將狀態(tài)演變做成動畫,看起來很炫,但是實際有沒有用,是否有業(yè)務(wù)價值呢?張磊博士進行了驗證,如果這個圖畫的比較有意義,用來進行營銷應(yīng)該能帶來幫助。銀行以前做了結(jié)構(gòu)化存款的響應(yīng)預(yù)測模型,用常規(guī)數(shù)據(jù)丟進去跑一個模型,現(xiàn)在我們用客戶微細(xì)分之后得到更多的圖像特征,如果有提升就代表有價值,最后驗證結(jié)果是前5%的名單命中率提高25%,前10%名單命中率提高14%,驗證了產(chǎn)生的這些圖像特征可以給業(yè)務(wù)明顯幫助。


索信達(dá)控股首席科學(xué)家張磊博士認(rèn)為,人工智能是銀行業(yè)把握科技變革對商業(yè)社會重塑的奇點性機遇,重新認(rèn)知和構(gòu)建銀行的生態(tài)和企業(yè)價值鏈,重塑銀行與社會和客戶的鏈接。《規(guī)范》的發(fā)布有助于引導(dǎo)金融機構(gòu)充分發(fā)揮人工智能“頭雁效應(yīng)”,加快金融數(shù)字化轉(zhuǎn)型步伐,持續(xù)推動金融服務(wù)更為貼心、更加智慧、更有溫度,打造數(shù)字經(jīng)濟時代金融創(chuàng)新發(fā)展新引擎,助力健全具有高度適應(yīng)性、競爭力、普惠性的現(xiàn)代金融體系。索信達(dá)將會攜手銀行金融機構(gòu)共同把握未來銀行的機遇,賦能金融生態(tài),共享金融AI未來。
免責(zé)聲明:市場有風(fēng)險,選擇需謹(jǐn)慎!此文僅供參考,不作買賣依據(jù)。












