风控模型算法常见于金融领域,包括但不限于商业银行、持牌消费金融公司、汽车金融公司、互联网金融、保险公司、互联网上市公司等各行各业。随着NLP、机器学习算法、神经网络技术等快速发展,大数据风控模型已经广泛应用于各类商业领域。! K5 {2 {: n$ \! d3 p& h
" X4 Q: o& U+ Z! \7 k* p一、什么是风控模型算法?
9 h' ^3 `" ^* ^3 t- x+ d b% z
! L- y) {3 O# b$ `* O5 _& w风控模型算法是一个比较泛泛的概念,包括很多内容,依据d款流程,可以分为贷前、贷中、贷后风控模型,依据风险控制的对象又可以分为企业风控模型和个人风控模型,其中企业风控模型基于场景又可以细分为财务风险模型、税务风险模型、担保风险模型、订单和库存风险模型、进出口风险模型、关联风险模型、僵尸企业识别模型等等,而这些模型中又包括各种各样的算法,其如在金融风控模型中,常用的且比较经典的算法——逻辑回归(logistic回归)、决策树、线性回归、神经网络、K均值聚类分析、极限梯度模型。4 N9 F& q8 a# r; k
" ~# @0 n/ {' f. _* W9 Z% p二、风控模型算法有哪些?
. z5 O. W5 T! C' x
8 C6 A' I: {' d" i1、逻辑回归模型: e* l8 U4 Q# E
) v# O3 [6 V% z' x3 ?; f
逻辑回归模型最早可以追溯到 1830 年代,当时比利时统计学家 P.F. Verhulst 发明它来描述人口动态。% b9 T1 ?$ |% }1 z
0 C0 G e* g& X# i @% {; d
之所以常用于风控模型,主要在于其优点比较突出,包括但不限于该模型结果可解释较强,模型适用性较好,可以适用于连续性和类别性自变量,此外,预测结果是介于0和1之间的概率,因此,该算法被广泛使用。- l: b, G- O+ U% Q; p/ A9 T h" y4 T
2 |! U9 v# C% l! m
3 B4 Z0 t! A3 c
& M% D* \0 `3 e H2、风控模型算法—层次聚类算法(Hierarchical Clustering)
) z ~' Y- y1 W; N& x0 F9 e. h: i; b+ S! W& L
层次聚类算法将相似样本合并为为一簇,并不断迭代,生成聚类的过程,如下图
$ z, _- f* G# R/ S+ ~3 M, N
( j% A) i2 l; [( S/ X& `5 n
: }$ A; W4 t$ v) _% V
" j- s! x2 t% |K均值(Kmeans)聚类算法是一种无监督学习聚类算法。对数据集中在某些方面相似的数据成员进行分类组织。通过指定想要划分的类别个数K,将没有标注的 M 个样本通过迭代的方式聚集成K个簇。其中,样本间的相似度以样本之间的距离作为指标来划分。9 |: ?3 ~+ ~8 q- Q
' N: T) f G2 m2 o
# j. q, T- e3 ^ m
" O R f' Y% E# i3 |备注:Kmeans算法的所有账户聚类结果 K=3
: E" K+ o( C" y, c% D/ c6 U& c) K$ S& K$ h8 G9 M
冰鉴科技基于K均值(Kmeans)聚类算法开发出了经侦反洗钱解决方案,基于银行帐户交易流水数据,为经侦在线索梳理和案件侦破过程中提供更便捷、更高效、更智能的技术方案支持。: v/ O9 [% W/ Z+ H5 e
8 z. Q4 O0 X6 F8 ]3、XGBoostT
- s1 p! P! ~0 ^) @: k* k m7 k
) U8 G$ Q+ V& z6 DXGBoostT全称极限梯度算法,是由2016年由华盛顿大学陈天奇老师带领开发的一。XGBoost是一个可供用户轻松解决分类、回归或排序问题的软件包。它内部实现了梯度提升树(GBDT)模型,并对模型中的算法进行了诸多优化,在取得高精度的同时又保持了极快的速度。目前,已经广泛应用于各类风控模型领域。
# _3 y3 S' `2 Q1 E' o' F. ]: h2 b/ {6 y# V
线性回归、神经网络等其他三类算法在金融风控、经济预测等模型搭建领域也是比较常见的,再次不一一介绍。
; o. y" T; r/ L% `# h7 A, j! D6 h5 \ w6 u( U1 S2 Y
好了,以上是对风控模型算法的介绍,欢迎交流。
3 e) e3 J9 a0 e9 m6 r K; N银行风控模型https://www.icekredit.com/page/1731: _( P! y) O/ ?8 x& N* c3 N
|