機器學習已經存在了很長時間,但大資料革命和計算能力成本的暴跌現在使它們成為真正優秀和實用的分析工具,用於處理各種(包括信用風險)銀行業務。
機器學習演算法聽起來可能很複雜且太過於未來了,但它們的工作方式非常簡單。本質上,它們將大量的決策樹(即一個決策模型,它打破了個人決策和可能的後果,也稱為“學習者”)結合起來建立一個準確的模型。透過高速攪動這些學習者,機器學習模型能夠找到“隱藏”模式,特別是從常見統計工具遺漏的非結構化資料找。
機器學習的優勢在於分析 long-tail 資料,這些資料通常佔銀行投資組合的一半,但透過傳統的統計方法不能很好地理解。比如賬戶份額低的帳戶,我們通常對它們知之甚少,並且採取策略往往是相當反應性的,但是機器學習有能力洞悉他們的行為,積極瞄準能夠潛在盈利的賬戶。機器學習模型(Random Forest 和 AdaBoost)的表現明顯優於其他模型,將模型的預測能力提高了1.6倍。這種改善從現有模型下的較低風險賬戶的顯著收入的提高看出。這也會減少信貸額度,並有助於避免信貸額度增加但最後逾期導致壞賬而出現的虧損。銀行的關鍵意義在於他們現有的模式在賬目上有著很多價值,而機器學習提供了一種實用的方式去抓住這些價值,所以幾乎可以肯定,未來銀行可以透過更為複雜的機器學習模型來獲取更多的價值。
機器學習已經存在了很長時間,但大資料革命和計算能力成本的暴跌現在使它們成為真正優秀和實用的分析工具,用於處理各種(包括信用風險)銀行業務。
機器學習演算法聽起來可能很複雜且太過於未來了,但它們的工作方式非常簡單。本質上,它們將大量的決策樹(即一個決策模型,它打破了個人決策和可能的後果,也稱為“學習者”)結合起來建立一個準確的模型。透過高速攪動這些學習者,機器學習模型能夠找到“隱藏”模式,特別是從常見統計工具遺漏的非結構化資料找。
機器學習的優勢在於分析 long-tail 資料,這些資料通常佔銀行投資組合的一半,但透過傳統的統計方法不能很好地理解。比如賬戶份額低的帳戶,我們通常對它們知之甚少,並且採取策略往往是相當反應性的,但是機器學習有能力洞悉他們的行為,積極瞄準能夠潛在盈利的賬戶。機器學習模型(Random Forest 和 AdaBoost)的表現明顯優於其他模型,將模型的預測能力提高了1.6倍。這種改善從現有模型下的較低風險賬戶的顯著收入的提高看出。這也會減少信貸額度,並有助於避免信貸額度增加但最後逾期導致壞賬而出現的虧損。銀行的關鍵意義在於他們現有的模式在賬目上有著很多價值,而機器學習提供了一種實用的方式去抓住這些價值,所以幾乎可以肯定,未來銀行可以透過更為複雜的機器學習模型來獲取更多的價值。