歡迎來到21315企業征信系統

當前位置:首頁 > 新聞 >

解碼大數據征信

信用中國網 閱 : 3050

長久以來,我國征信市場都是以央行為主導的單一格局。央行征信系統主要收集以銀行信貸信息為核心的企業和個人信息,截至2015年4月底,該系統收錄自然人8.6億,其中有信貸記錄的3億人,收錄企業及其他組織近2068萬戶。

  

 

所以,不管是在用戶的覆蓋面還是數據的多樣性上,央行征信系統都有很大的局限性。如何滿足其他沒有征信記錄的5億多人的金融需求?這便是大數據征信所覬覦的市場機會。

  

傳統信用評估模型是根據一個人的借貸歷史和還款表現,通過邏輯回歸的方式來判斷這個人的信用情況。而大數據征信的數據源則十分廣泛,包括電子商務、社交網絡和搜索行為等都產生了大量的數據。

  

這些數據在信用評估中的效用究竟如何?大數據征信是言過其實,還是真的風控神器?群雄逐鹿征信市場,誰能成為最后的贏家?從金融服務到生活服務,中國的個人征信機構究竟有何“野心”?

  

帶著以上問題,《第一財經日報》于近日專訪了芝麻信用的總經理胡滔、騰訊征信總經理吳丹、FICO中國區總裁陳建、京東金融消費金融總監許凌、芝麻信用首席科學家俞吳杰、美國Zest Finance前模型組創始人顧凌云等。

  

一. 解碼大數據征信:征信市場新格局

  

個人征信牌照的發放久拖未決,但央行于近日率先發布了一份《征信機構監管指引》(下稱《指引》)。業內普遍認為,該文件的發布正是為了給個人征信牌照的下發鋪路。

  

根據《指引》,監管部門對于申請牌照的機構提出了多項具體要求,包括個人征信機構設定保證金制度、股權變革的制度化管理等,以規范個人征信這個新興行業的發展。

  

但事實上,個人征信市場的參與者除了首批八家申請征信牌照的機構外,以拍拍貸、積木盒子為代表的P2P平臺,以京東金融、宜信為代表的互聯網金融公司,以FICO為代表的第三方機構均開始利用既有的數據和技術布局大數據征信業務。

  

征信市場新格局

  

今年1月5日,央行下發《關于做好個人征信業務準備工作的通知》,個人征信業務正式“開閘”。騰訊征信、芝麻信用、深圳前海征信、鵬元征信、中誠信征信、中智誠征信、考拉征信、北京華道征信獲準開展個人征信業務準備工作。

  

其中,背靠螞蟻金服的芝麻信用和騰訊旗下的騰訊征信因其用戶覆蓋面廣、數據規模龐大、技術實力雄厚而最具競爭力。另外,前海征信因背靠綜合金融集團——中國平安也被視為有力的競爭者。

  

此外,考拉征信則匯集了拉卡拉平臺上進行信用卡還款、轉賬、公共繳費等個人用戶數據。華道征信的數據則主要來自其兩家股東:新奧資本握有大量的居民燃氣數據;銀之杰旗下的億美軟通是中國三大電信運營商資深的戰略合作伙伴。

  

而另外三家機構中,中誠信征信和鵬元征信的大股東均是老牌的企業征信公司,以企業信用評級業務起家。中智誠征信是民營第三方征信公司,以“反欺詐”業務為主。

  

其實,除了上述八家首批獲準開展個人征信業務的機構外,不少擁有海量數據和技術基礎的公司都在暗暗布局大數據征信市場。另據媒體報道,包括京東金融、百度金融、小米、宜信等30多家企業均有意申請第二批個人征信牌照。

  

以京東金融為例,除了盤活集團內的數據資源外,京東還于今年6月宣布投資美國的Zest Finance。這家由Google前副總裁創辦的互聯網金融公司主要利用機器學習算法和數據技術幫助用戶做出更精準的金融風控及營銷決策。

  

據了解,雙方宣布成立一家名為JD-Zest Finance Gaia的合資公司,旨在利用Zest Finance在大數據挖掘和處理方面的技術構建京東自己的信用評估體系,目前Zest Finance的技術專家已經到位。

  

另一家大數據征信市場的有力競爭者——宜信旗下的至誠征信也在今年6月發布一款針對P2P機構、小額信貸機構和銀行信貸部門的風控產品,包括信用評分、個人借款數據、個人風險名單數據三塊內容。

  

此外,包括拍拍貸、積木盒子在內的P2P借貸機構也利用過去幾年所積累的數據建立自己的信用評估體系。以拍拍貸為例,它于年初推出了基于大數據的風控模型——“魔鏡系統”。

  

除了那些手握數據資源的公司外,圍繞大數據征信領域的第三方技術和服務機構也開始涌現。例如,專注大數據挖掘的“百分點”、在在數據源上層完成數據分析和信用評估的“冰鑒科技”、“閃銀”等。

  

最終僅剩兩三家?

  

但值得注意的是,與其它很多行業不同,征信市場的“容量”卻十分有限。

  

對比美國,1960年代末美國的征信公司曾一度多達2200家,但隨著行業不斷發展和整合,如今已減少到400家左右。其中,艾可飛(Equifax)、益百利(Experian)和全聯(Trans Union)三大巨頭便占到了90%的市場份額。

  

芝麻信用曾在內部提到,當下大數據征信還處于第一階段,即個人征信機構跑馬圈地、百花齊放;而到了第二階段,征信行業或出現大規模并購,最大的兩三家公司將占據市場60%以上份額或者更多,其他幾家共享細分市場。

  

這個預判基本已經成為行業共識

  

顧凌云認為,中國的征信市場在三到五年之內不會一統天下,原因是因為到目前為止中國征信市場還處在第一步,也就是數據源整合這一步。但是在今后四五年之后應該會有兩到三家成為最終的贏家。

  

許凌認為,大數據征信需要前期投入巨大的人力、物力,不僅周期長且回報慢。尤其是個人征信這部分,對于數據、資金、技術,以及場景都有很高的要求,最終只會有兩三家主導市場。

  

眼下國內的個人征信市場剛剛放開,還處于群雄逐鹿的階段。盡管首批僅有八家機構申請牌照,但在業內人士看來,相比牌照,數據和技術才是個人征信領域更為關鍵的門檻。

  

平安證券在一份報告中稱,根據征信行業的產業鏈,個人征信公司經營成功的關鍵在于:數據來源的范圍和準確性、數據處理能力、數據產品是否能夠滿足客戶要求、是否具有多樣性。

  

目前來看,除了獲得牌照的機構之外,掌握信息搜索和網頁瀏覽數據的百度、整合了電商、金融、生活服務數據的京東、積累了九年數據的互聯網金融機構宜信、以及正在積極布局中國大數據征信市場的FICO都是有力的競爭者。

  

二. 解碼大數據征信:大數據征信的“是與非”

傳統信用評估模型是根據一個人的借貸歷史和還款表現,通過邏輯回歸的方式來判斷這個人的信用情況。而大數據征信的數據源則十分廣泛,包括電子商務、社交網絡和搜索行為等都產生了大量的數據。

  

大數據征信可以通過我們在互聯網上留下的這些“足跡”清晰地描繪出一個人,但如何把控數據源的“量”與“度”,各家機構還在不斷嘗試。更重要的是,最終繪制出的人物“肖像”與個人信用究竟有多大的關聯度,至今仍存有爭議。

  

此前亦有接近監管部門人士對《第一財經日報》記者表示,個人征信牌照遲遲未能落地,其原因之一也在于監管部門對于大數據征信的商業化應用存有疑慮。尤其,以人臉識別為代表的關鍵技術的可靠性還有待進一步檢驗。

  

何為大數據征信?

  

在FICO中國區總裁陳建看來,征信的本質就是采集和記錄信用信息并在整理加工后提供給決策者,而如今,得益于大數據、云計算、人臉識別、深度算法等技術的進步,征信有了更廣泛的意義和用途。

  

“只要對消費者的特征描繪和風險判斷有顯著作用的就可以叫征信。”陳建認為, 現在一切信息皆可以成為信用數據,經過分析后用于證明一個人或企業的信用狀況。因為數據覆蓋廣、維度多,因此形成了廣義的征信,也就是大數據征信。

  

陳建表示,有價值的大數據具備幾個因素:第一要覆蓋面廣,用戶足夠多,例如銀聯、電信的數據;第二維度要有效,能夠有效轉為結構化的數據,例如電商的數據;第三信息要穩定。

  

不過,對于這種日益崛起的征信新業態,今年7月在上海外灘舉辦的“2015上海新金融年會”上,央行征信中心副主任王曉蕾直截了當地提出了疑問,“我不知道你們說的‘征信’是什么”?

  

央行的征信系統是一個“放貸人之間的信息共享數據庫”,主要采集的數據位身份信息、信貸信息、非金融負債信息三類,以及部分公共信息。因此,王曉蕾對于征信的基本定義為,“從放貸人那里采集借款人信息”。

  

而另一個“糾結”的概念在于,王曉蕾認為,放貸機構之“征信”是放貸機構基于內部信息的風險管理過程,而征信行業之“征信”是為放貸機構的風險管理提供外部信息支持的活動,征信機構應該是一個純粹的獨立第三方。

  

如果按照這個界定,我們現在所談到的大數據征信跳脫了傳統“征信”范疇內。不再局限于金融屬性的信息,并且也打破了“采集者與信息產生沒有任何關系”的獨立第三方原則。

  

例如芝麻信用、前海征信、騰訊征信,一方面它們的數據來源目前還主要來自母公司阿里、平安、騰訊,而另一方面,它們的兄弟公司又涉足放貸業務,例如阿里小貸。

  

盡管有關大數據征信的定義和效用仍爭議不斷,但對于既無法接入央行征信系統又面臨快速發展的互聯網金融行業而言,利用大數據來幫助判定風險、開拓業務已是必然的選擇。

  

從應用范圍來看,目前大數據征信已從金融業務向生活服務蔓延。其中,最核心的兩個價值就是:防范欺詐風險和信用風險。簡單來說就是:既要證明“你是你”,還要描述出“你是什么樣的人”。

  

如何證明“你是你”?

  

無論是在傳統金融領域,還是互聯網金融領域,給客戶做信用評估的前提是必須知道這個人就是他自己。所以,如何利用證明“你是你”是大數據征信首先要解決的問題。

  

尤其,隨著越來越多的金融業務互聯網化,“反欺詐”面臨的挑戰也日益增大。“身份認證”的重要性在各項監管文件中反復被強調,而各家機構也在不斷探索如何利用新的技術在網上實現身份的核實。

  

其中,在指紋、虹膜、人臉識別等一系列生物識別技術中,人臉識別因其技術的成熟度和準確率,以及使用的便捷性而被進一步普及。包括騰訊征信、芝麻征信在內的多家個人征信機構都有組建自己的人臉識別技術團隊。

  

此前,在騰訊征信的北京媒體溝通會上,為騰訊財付通、微眾銀行、騰訊征信等提供圖像和模式識別技術支持的優圖團隊也向大家展示了“人臉識別”在“反欺詐”方面的應用,即如何證明“你是你”。

  

根據現場的演示,在上傳身份證照片、自拍照片并與公安部的信息進行比對之后,“人臉識別”的另一關鍵步驟是活體檢測,通過讀取隨機的數字串,分析聲音和唇語等信息來防范有人用視頻、照片等方式來仿冒用戶。

  

據了解,在今年國際權威的人臉識別數據庫LFW上,騰訊優圖團隊在人臉驗證測試中達到了 99.65%的準確率。目前,微信的“人臉識別”技術已經在騰訊征信、微眾銀行、微證券開戶等場景中開始試用。

  

盡管人臉識別的準確率已經達到較高水平,但該項技術的商業化應用才剛剛起步,它的有效性和安全性仍備受質疑。

  

優圖團隊研發總監黃飛躍也表示,該技術現在還不能說100%的成熟,而是適用于某些特定的應用環境中。其中,金融領域的身份核實條件較好,由于用戶往往是為了通過驗證(例如支付)所以比較配合。

  

芝麻信用首席科學家俞吳杰表示,整個的反欺詐產品從身份認證到信息驗證再到網絡關聯,每一步的技術含量非常高。以身份認證為例,現在已有有很多的途徑,比如信息交叉比對、人臉識別技術、KBA問答認證等。

  

他以網絡關聯技術為例說明到,它能把所有出現過違約行為的身份,手機,設備等關鍵點都在風險庫里面分門別類的保留下來,我們可以通過一層或者多層關聯找出所有的風險點供合作伙伴參考,這對技術和硬件要求都是非常高的。

  

爭議大數據征信

  

解決了“身份認證”的問題,接下來就要評估你的信用,即描述出“你是什么樣的人”。

  

在關于大數據征信的文章中,我們經??梢钥吹揭恍┌咐?,如經常半夜上網的用戶可能被認為沒有穩定的工作而降低信用評分,買雙開門冰箱的用戶可能因為有家庭而信用評分較高,微博更新頻繁的用戶可能因為社交活躍而信用評分較高等。

  

“這些考量因素被過度放大了,也許這只是用戶個人習慣而已。但每一個因素與個人信用的相關性有多大?我們還無法完全解釋,尤其當數據源不足夠豐富時,這些評判便存在欠缺。”芝麻信用的技術專家景藝亮表示。

  

冰鑒科技CEO顧凌云在回國前曾領導并開發了Zest Finance前四代風控模型,在他看來,大數據征信的核心并不是對某個變量極其依賴,而是把很多個都只有微小影響的變量通過非線性的算法整合在一起,從而使模型的整體表現更好。

  

“大數據其實并不一定就是數據量本身大,我們講求的是變量涵蓋的信息緯度要多和均衡,然后才是能夠通過淺度學習和深度學習等多種復雜的算法把這些變量更有效地柔和在一起。”他表示。

  

王曉蕾認為,互聯網記錄了借款人以前不可記錄的行為,獲得了以前無法、或成本很高的數據,有利于為放貸人了解借款人是誰、有沒有還款能力和還款意愿提供了新的渠道和方法。但是,相關的信息究竟如何使用有待進一步研究驗證。

  

王曉蕾引用2014年美國政策與經濟研究委員會(PERC)的一項研究結果稱,非金融信息在信貸決策中的作用有限。例如,研究就初步發現,社交信息對于判斷借款人的還款意愿和能力暫無預測力。

  

“而諸如水、電、煤、有線電視、手機等非金融信息納入征信系統,顯著地提高了薄信用檔案人群的信貸獲得能力,但對于厚信用檔案人群而言邊際作用不大。”她表示。

  

“只有好樣本,沒有壞樣本是無法建立有效的信用評估機制。” 宜信至誠征信的董事總經理趙卉表示,電商、支付、社交等數據只能作為信貸審核的參考值,而貸后數據才是強參數。

  

對于這種論斷,互聯網公司們顯然是不贊同的。

  

騰訊征信總經理吳丹告訴記者,從這段時間內測的結果來看,在模型中加入社交數據以后,對它的風控能力有20%—25%的提升,尤其在小額貸款領域。因為,通常一筆幾百塊的借款,違約發生的原因不在于借款人的還款能力而是意愿。

  

俞吳杰表示,通過大量的研究證明,人的行為數據和他的信用有直接關聯,因為行為很難撒謊。從這段時間公測的結果來看,用戶的芝麻分越高,其貸款的違約率越低,二者呈單調、線性的關系,這也證明了芝麻分在信用評估上的有效性。

  

不過, 僅僅依靠互聯網上的數據并不足以建立一個強大的信用評估體系。顯然,所有大數據征信的市場參與者都深知這一點。“在未來,把傳統數據和創新數據結合到一起,一定是我們要到達的終點。”芝麻信用的總經理胡滔如此總結到。

  

顧凌云告訴記者,風控模型本質上還是對一個人金融還貸能力的預測和評估,所以,盡管Zest Finance大量采用非傳統的信用數據,但在大部分的風險評估模型中,傳統的信用數據(銀行信貸數據)依然占有一定的比重,平均也在40%左右。

  

三. 解碼大數據征信:誰會成為中國版“FICO”

大數據征信導出產品的方式之一是構建一個可被廣泛采用的信用評分體系,而從國外的經驗來看,通過評分而不是數據報告的方式呈現征信結果,也是一個解決隱私保護問題最好的途徑。

  

因此,目前多家機構都率先推出了各自的信用評分體系。例如,芝麻征信的“芝麻分”、華道征信的“豬豬分”、拉卡拉征信的“考拉分”、前海征信的“好信度”、騰訊京東金融的“白度”、拍拍貸的“魔鏡分”、騰訊的信用星等。

  

從呈現方式來看各不相同,例如,“芝麻分”的范圍在350分到950分之間,分數越高代表信用程度越好;“白度”則是從0到100度;騰訊的信用評分則沿用QQ體系的習慣,用星級而非數字體現,七顆星為最高信用級別。

  

但比FICO“野心”更大的是,中國的個人征信機構正試圖把信用評分體系的應用范疇從金融領域擴展到生活領域,從租車、租房,到婚戀、求職等等。甚至,它們希望從改變大眾對信用的認知到提升社會的信用體系。

  

誰能打破數據孤島

  

在談及征信業務的發展時,大部分接受《第一財經日報》采訪的人士都提到了FICO分。盡管中美兩地的征信市場存有差異,但像FICO一樣形成一種被普遍采用,并具有行業標準價值的信用評分體系卻是各家征信機構都在努力的方向。

  

事實上,作為美國著名的個人消費信用評估公司,FICO本身并非一家征信公司,而是提供決策和分析管理技術的第三方服務機構。由于美國三大信用局都使用FICO分,每一份信用報告上都附有FICO分,以致它幾乎成為信用分的代名詞。

  

FICO中國區總裁陳建在接受本報專訪時表示,中國不缺數據,不管是阿里的電商數據,還是騰訊的社交數據都是可靠、大量且真實的,對于刻畫消費者的特征、風險有很好的作用,但是目前中國還沒有除央行以外很好的評分體系。

  

在他看來,中國建立一個全民評分體系的挑戰在于:個人征信市場剛剛放開,很多數據源之間還是一個相對封閉的“孤島”,例如傳統金融機構與互聯網公司之間是基本隔離的兩套體系,每一家互聯網公司之間又是各自獨立的一套體系。

  

由于“數據孤島”的存在,盡管現中國已經出現了很多信用評分體系,但距離一個能夠覆蓋全民的,被普遍認可的標準分還有不小的差距。那么,顯而易見的是,誰能率先打破數據割裂的狀況,誰就有望成為最終的那兩至三家勝出者。

  

所以,眼下各家機構除了努力盤活自身的數據資源,也在積極地尋求外部數據源。這既是征信業務本身的需要,更是中長期的戰略需求。

  

以芝麻信用為例,目前其數據來源包括阿里體系內的電商交易數據、互聯網金融數據,集團體系之外的公安網、最高法、工商、教育部等公共機構以及合作伙伴數據,以及用戶上傳的數據等。

  

而騰訊征信方面,除了擁有騰訊8億QQ賬戶、超過5億的微信賬戶、以及超過3億的支付用戶以及其他多種服務上聚集的用和社交數據外,騰訊也不斷利用在基金、理財、貸款、支付等領域的業務整合更多的數據資源。

  

但由于它們的兄弟機構多有涉略信貸或相關業務,例如阿里小貸、微眾銀行等,因此不少業內人士憂慮,這種既當裁判員又當運動員的做法可能在未來整合資源的過程存有障礙。

  

而FICO正是瞄準了這個“空隙”。作為信用評分領域的標桿企業,盡管FICO在中國缺少數據資源,但它希望利用自己多年積累的“獨立第三方”服務機構的口碑,通過技術優勢另辟蹊徑、殺出重圍。

  

據了解,FICO已在內部成立了互聯網金融事業部,專注開發適用于中國市場的大數據征信產品。它希望通過“云計算”技術在“云端”建立一個數據共享機制,打通“數據孤島”。

  

從金融到生活場景

  

要形成一套具有行業標準價值的信用評分體系,除了數據來源要足夠豐富和多元,更重要的是它必須被廣泛的采納和使用。

  

根據騰訊征信總經理吳丹的判斷,未來一兩年里,越來越多的金融產品會往線上遷移,向著快速便捷的方向發展,從國外和過往的經驗來看,越是便捷的產品面臨的風險越大,尤其是欺詐風險。

  

從各家征信機構披露的進展來看,大數據征信的產品主要可分為兩大類:反欺詐產品和信用評估產品。而適用范圍則是從商業銀行等傳統金融機構,到P2P等互聯網金融公司,甚至生活類的各種場景。

  

在銀行合作方面,目前芝麻信用與北京銀行信用卡中心、騰訊征信與廣發銀行信用卡中心的合作均已展開,商業銀行希望通過引入更多元的信用評估機制來刪選客戶。

  

此外,涉足信貸業務的P2P平臺、消費金融公司對大數據征信產品也有著強烈的需求。例如,P2P平臺積木盒子的消費信貸產品“讀秒”,面向大學生群體的趣分期等都對接了芝麻信用,對于每位借款人,芝麻征信都會給出一個信用評估結果。

  

前海征信也在不久前上線了針對P2P機構的三大系列、十款征信產品,并于陸金所聯合推出了P2P行業的“人民公社”,為P2P平臺提供獲客、增信、產品設計、征信、系統平臺、催收等服務。

  

但與專注于金融領域的FICO分不同,國內的機構一開始便把信用評分體系的適用范圍放寬到了衣、食、住、行的生活場景中。

  

騰訊征信希望把個人信用與商業、生活、住房、消費等相結合,而芝麻分的應用場景也已經延伸至神州租車、一嗨租車等租車網站,全國6千多家酒店,簽證服務,甚至婚戀網站。

  

今年5月,考拉征信也聯合了嘀嘀打車、愛大廚、E袋洗、e保養等眾多商家開展名為信用圈的活動,希望把考拉分覆蓋到衣食出行、居家養生、愛車保養等多個領域。

  

芝麻信用首席科學家俞吳杰認為,數據的應用有兩個方面,一個是偏好,一個是信用。當下,在互聯網革新商業的這個過程中,數據可以幫助商業機構更好的進行決策與轉型。不過,把具有強金融屬性的信用評分體系應用于生活場景,這在其他國家并沒有先例。

  

據了解,目前信用分從模型開發的樣本選擇,特征選擇,到最后的性能評估,都有一套非常完整的,跟金融和征信密切相關的體系。“它在生活場景中是否有用?”這也是芝麻信用的科學家們所擔心的問題。

  

據俞吳杰介紹,經過了半年的測試和大量的研究表明,芝麻信用分對用戶有較好的分辨能力。“如果一個人有持續的、良好的借貸還款行為,那么他在其他各個場景當中都會有類似的延續性、慣性在里邊。”

 

在冰鑒科技CEO顧凌云看來,大數據就是解決傳統數據倉庫所不能解決的問題,實現一切皆可數據化、一切皆可量化、一切皆可預測。按照顧的邏輯,隨著大數據挖掘和分析能力的進步,它可應用的范圍還將越來越廣。

  

從各家機構的發展規劃來看,除了通過類似生活場景的開拓與傳播增加個人征信的適用范圍外,它們更大的“野心”在于,從改變大眾對信用的認知到提升社會的信用體系。

 

相關新聞:

1
企業質量信用征信——相信21315品牌的力量

2
21315董事長陳澤華:談企業征信與新經濟發展

3
從《非誠勿擾》“21315”商標事件看我國司法對商標權的保護
貳壹叁壹伍(北京)征信管理集團股份有限公司·中品質協(北京)質量信用評估中心有限公司

21315微信公眾平臺

京ICP備12021023號-1 | 京公網安備11010102001227號

黑龙江11选5开奖查询 上证指数每日行情凤凰网 2018一19西甲赛程 云南麻将飞小鸡 平特一肖研究规律 上海时时乐走势图单选 上海福利彩票天天彩选3 深圳福利彩票什么时候开售 香港皇家彩库宝典131版 上证大盘年线图 2020中超联赛开赛时间