您好,欢迎您来到国盈网!
官网首页 小额贷款 购房贷款 抵押贷款 银行贷款 贷款平台 贷款知识 区块链

国盈网 > 贷款知识 > 企业贷款风控方案(贷款风控过不了怎么办)

企业贷款风控方案(贷款风控过不了怎么办)

风控实战 | 金融机构如何做好线上零售信贷风险管理,下面是融慧金科给大家的分享,一起来看看。

企业贷款风控方案

近年来,持牌金融机构数字化转型的一大重点发展方向是自主风控能力的建设。国家政策的正向引导与日益规范的行业格局均表明,唯有加强自主风控能力,才能在日益激烈的市场竞争中取得“先发优势”。

而谈到“风控能力”,仍有不少人认为风控就是做好“模型+策略”。但模型和策略仅是风险管理的两个重要工具,风险管理其实是对业务全生命周期中各个环节可能产生风险的经营,是与行业知识紧密结合的方法论与技能的组合,是能合理使用工具的前提。

本文我们将从风控基本理念、信贷产品设计、资产准入、风控策略方案、风险监控及迭代方案等方面展开介绍,希望为想入行信贷风控的同学、信贷风控的从业者和管理者提供一些借鉴和帮助。

目前,零售信贷业务面临的核心风险主要是客户的违约风险,而客户的违约风险可以通过两个关键点来识别:一是判断客户的还款能力,二是评价客户的还款意愿。因此,要做好这一风险管理工作,我们不仅需要依托策略和模型风控方案,也需要在业务的其他环节中设置相应的风控手段。

产品设计是信贷业务的起点,也是风险管理的起点。在该阶段,信贷产品的设计需要遵循一些原则,比如关注监管及政策要求,以免发生合规风险对业务正常开展造成影响;注重产品和目标客户的匹配,避免客群与产品错配带来大规模风险损失;在注重风控的前提下,简化产品操作流程,增强客户体验等。

产品设计阶段

除了通过自研产品开展信贷业务以外,资金方引入不同资产的流量,也是当前开展互联网信贷业务的主要途径。为了实现业务发展的目标,在资产准入阶段对于资产的风险现状、风险变化趋势、以及业务健康度等维度进行充分调研和评估,只选取适合的资产予以准入,可以显著提高整个团队的资源使用效率。

资产准入评估的主要维度,包括:基本信息、资产规模、当前合作情况、风险表现、资产方风险能力评估、资产客群评估等,通过不同维度的数据分析,可以深入了解资产方当前的业务健康度、资产稳定性和风控能力等情况,然后再通过现场尽调的形式,可以进一步帮助资金方综合判断资产方是否适合准入。

在产品设计或资产准入之后,信贷业务的开展需要依托于覆盖业务各个环节的风控策略方案。对于信贷业务,风控策略方案也是风险管理的主体,是实现风控目标和业务目标的重要步骤。

不过需要注意的是,实际业务中并没有“完美”的策略方案,策略方案也需要根据执行情况、业务变化等因素及时调整,所以持续的监控和迭代工作必不可少。

对于上述内容的详细分享,以及信贷风控中不同模型策略体系下的应用场景及风控思路解析、全业务风控流程中各环节的策略分析、模型和策略监控的重点方向、策略方案迭代机制等更多实战干货讲解,请扫码观看本期的《线上零售信贷业务风控实战》!

以下是本期知识大纲:

课程目录

1.风控基本介绍

2.产品设计阶段

1)产品设计的主要原则

2)产品设计流程中的风控手段

3.资产准入阶段

1)资产准入评估的主要维度

2)资产准入的常规流程

4.风控策略方案

1)贷风控中三种模型策略体系介绍

2)策略与模型的关系对比分析

3)贷前风控环节及评估维度分析

4)贷中风控环节及评估维度分析

5)贷后风控环节及评估维度分析

5.监控和迭代方案

1)模型&策略重点监控方向

2)策略方案迭代机制建立

课程收益

1.系统学习零售信贷业务风控理论知识,强化全栈视角,掌握风险管理全流程工作要领。

2.了解信贷风控中不同的模型策略体系,掌握模型策略的监控和迭代方案,以更好地应用到业务实践中。

课程对象

1.毕业想入行风控的同学

2.传统行业在职想转岗的同学

3.金融信贷风险管理从业人员,包括:

零售信贷业务团队负责人、核心团队成员,风险管理部门或IT部门信贷策略及模型人员等。

该课程也非常适用企业内训。

贷款风控过不了怎么办

异常检测(Outlier Detection / Anomaly Detection),也称之为离群点检测,是找出与其他数据存在明细差异的数据的过程,被找出的数据被称之为离群点或者异常点。异常检测在风控领域中的应用十分广泛,主要包括建模前数据样本清洗、个体欺诈检测、preA预筛模型和冷启动等。工业界常用的异常检测算法有很多,可以参考下图,其基本思想都是基于异常点的分布与绝大部分非异常点的分布有着明显的异常。下面我们会挑几种在信贷风控中经常用到的几种异常检测算法进行简单的介绍。

3-sigma准则

  3-sigma准则是一种基于数据样本服从正态分布的假设之上的,认为分布在3-sigma之外的数据都是异常数据。3-sigma准则为,如果一批观察到的数据样本的分布服从正态分布,那么:

数值分布在[μ - σ, μ + σ]中的概率为0.6826
数值分布在[μ - 2σ, μ + 2σ]中的概率为0.9545
数值分布在[μ - 3σ, μ + 3σ]中的概率为0.9973

  其中μ是样本的数学期望,σ为一个标准差。根据3-sigma准则,我们可以认为数据的分布几乎全部集中在(μ - 3σ, μ + 3σ)的区间内,超出这个范围的可能性仅占0.27%左右。一个标准的正态分布的曲线如下图所示:

  3-sigma准则获取3-sigma准则上下边界的代码如下:

# 3-sigmadef three_sigma(s):    mu, std = s.mean(), s.std()    lower, upper = mu - 3 * std, mu + 3 * std    return lower, upperdata = np.array([1,1,2,2,2,2,1,1,4,3,2,1,4,5,3,3,6,3,4,5,5,5,7,100])lower, upper = three_sigma(data)lower, upper
(-51.12569990049202, 65.45903323382535)
z-score

  z-score也称之为标准分,也是一种对数据分布的评估方式之一,其计算公式如下:

  z-score的绝对值越大,表明数据的异常程度越高。一般事先会给定一个阈值,然后认为超过这个阈值的数据就是异常数据,3-sigma准则就是z-score在服从正态分布下的一种特例。z-score有个明显的缺点就是假设样本满足正态分布,然而实际大部分场景下,样本并不满足整体分布这一假设条件。

# Z-scoredef z_score(s):    return (s - s.mean()) / s.std()data = np.array([1,1,2,2,2,2,1,1,4,3,2,1,4,5,3,3,6,3,4,5,5,5,7,100])zscore = z_score(data)zscore
array([-0.31736574, -0.31736574, -0.26590102, -0.26590102, -0.26590102,       -0.26590102, -0.31736574, -0.31736574, -0.1629716 , -0.21443631,       -0.26590102, -0.31736574, -0.1629716 , -0.11150688, -0.21443631,       -0.21443631, -0.06004217, -0.21443631, -0.1629716 , -0.11150688,       -0.11150688, -0.11150688, -0.00857745,  4.77764099])
箱线图

  箱形图(Box-plot)是一种用来显示一组数据分散情况的统计图,因外形似箱子而得名。箱线图主要靠四分位数来实现的,分为数指的是将一组已排序的数等分成若干个区间的过程。四分位数表示将一组数据分成四等份。箱线图主要设计到如下几个概念:Q1:下四分位数;Q2:中位数;Q3:上四分位数,IQR(Inter Quantile Range):四分位距;Maximum:上边缘;Minimun:下边缘。其中:

这样我们认为在上边缘之上的数据和在下边缘之下的都是异常点。

# 箱线图def boxplot(s):    q1, q3 = np.quantile(s,.25), np.quantile(s, .75)    iqr = q3 - q1    lower, upper = q1 - 1.5*iqr, q3 + 1.5*iqr    return lower, upperdata = np.array([1,1,2,2,2,2,1,1,4,3,2,1,4,5,3,3,6,3,4,5,5,5,7,100])boxplot(data)
(-2.5, 9.5)
LOF

  LOF(Local Outlier Factor, 局部离群因子)是基于密度的经典算法,它通过给每个数据点都分配一个依赖于邻域密度的离群因子LOF,进而判断该数据点是否为离群点。如果某个点的LOF值越小,证明其领域的局部可达密度就越低,那么我们认为这个点是异常点的可能性就越大。LOF的好处在于可以量化每个数据点的异常程度(outlierness)。LOF算法的实现流程如下:

对所有样本去重,计算所有样本点之间的距离,用一个矩阵保存所有样本点之间的距离。指定邻域样本数量k,为每个样本点挑选出距离最近的k个近邻,然后计算LOF得分,并将其做为异常分。根据设定的异常分阈值,挑选出LOF值超过阈值的样本。

LOF算法的整体思路非常简单,为了深入理解LOF算法,需要先了解几个概念:

距离:样本点和样本点之间的距离可以用来表示,距离的计算一般可以选择欧式距离,也可选择其他距离度量方式。k-近邻距离(k-distance):距离样本点最近的第k个样本点与点之间的距离,记为。k-近邻:样本点的k近邻表示与样本点的距离小于等于k近邻距离的所有样本点的集合, 记为,其中没有重复样本点。可达距离(reachability distance):样本点到样本点的可达距离为样本点的k-近邻距离和样本点和的最大值,即:

局部可达密度(Local Reachability Distance):样本点p的局部可达密度为样本点p与其k-近邻的平均可达距离的倒数,计算公式如下:


  根据局部可达密度的定义,如果一个样本点在样本空间中且距离其他样本点比较远的话,它的局部可达密度也就比较小。但是直接计算绝对密度是不合理的,因为数据分布的密度不同,可能会导致一些虽然稠密但是相对稀疏的点被认为是异常点,因此有了局部异常因子的概念。

局部异常因子(LOF):对于空间中的样本点p,其局部异常因子的计算公式如下:
上述公式的含义为:样本点p的局部异常因子为样本点p的k-近邻的平均局部可达密度
与样本点p的局部可达密度的比值。因此一个样本点LOF值越小,其异常程度就越大。

实现代码如下:

from sklearn.neighbors import LocalOutlierFactor as LOFX = [[-1.1], [0.2], [100.1], [0.3]]clf = LOF(n_neighbors=2)res = clf.fit_predict(X)print(res)print(clf.negative_outlier_factor_)
[ 1  1 -1  1][ -0.98214286  -1.03703704 -72.64219576  -0.98214286]
IF(Isolation Forest)

  鼓励森林(Isolation Forest, IF)是一种工业界使用频率较高且效果比较好的异常检测算法之一,该算法由南京大学周志华教授提出,是一种基于空间随机划分思想的ensemble算法。IF算法的每次随机划分过程如下:

1.从样本空间中随机选择一部分样本,并从特征空间中随机选择一个特征。

2.在步骤1选择的特征空间范围内中随机选择一个值作为当前的划分点,对特征空间进行划分,将小于当前划分点的特征值划分到左子树,将大于当前划分点的特征值划分到右子树。

3.递归执行步骤2,直到当前样本空间不可分为止。

  由于每次随机划分都会形成一棵二叉树,为了屏蔽单棵树的偶然性,所以通过多次随机重复生成多个相互孤立的树来增强模型的稳定性,这也就是孤立森林这个名称的来历。



  说完样本的划分过程,接下来详细介绍一下IF中用到的跟异常值计算相关的几个概念:

路径长度:样本点在当前孤立森林中某个数T中的路径长度为:其中表示当前样本点在二叉树中的高度,即从树的根部走到当前节点所需要经过的最短节点数,是一个偏置项。平均路径长度:平均路径长度指的是在当前孤立森林中,样本点的平均路径长度,公式为:
其中K表示当前孤立森林中树的个数, 表示样本点在第棵树上的路径长度。平均搜索路长:为 n个样本构建一个二叉搜索树BST中的末成功搜索平均路径长度 。计算公式如下:
其中n指的是当前树种样本的个数,,其中为欧拉常数。异常分:在明确了平均路径长度之后就可以得到IF的异常值计算公式:
其中表示样本在所有树上的平均路径长度,表示每个树的理论平均长,作为归一化项。
from sklearn.datasets import load_iris from sklearn.ensemble import IsolationForest# 导入iris数据集data = load_iris(as_frame=True) X,y = data.data, data.target df = data.frame # 训练IFiforest = IsolationForest(    n_estimators=100,     max_samples='auto',      contamination=0.05,     max_features=4,      bootstrap=False,     n_jobs=-1, random_state=1)# 异常判断,-1为异常,1为正常df['label'] = iforest.fit_predict(X) # 异常评分df['scores'] = iforest.decision_function(X)df.head(10)

  除了上述的几种异常检测算法,还有些算法的附带成果可以用来进行异常检测,如KNN和DBSCAN,其中DBSCAN是一种基于局部可达的聚类算法,在该算法中,不能进行聚簇的样本都可以视为离群点和异常点,也就是说DBSCAN在聚类的同时,把离群点检测的事儿也干了,关于DBSCAN,在后面介绍聚类算法的时候会详细介绍。异常检测算法这里就先介绍这么多,在后面有时间接着补充。

温馨提示:注:内容来源均采集于互联网,不要轻信任何,后果自负,本站不承担任何责任。若本站收录的信息无意侵犯了贵司版权,请给我们来信(j7hr0a@163.com),我们会及时处理和回复。

原文地址"企业贷款风控方案(贷款风控过不了怎么办)":http://www.guoyinggangguan.com/dkzs/82856.html

微信扫描二维码关注官方微信
▲长按图片识别二维码