You are on page 1of 14

基于感知机算法的个人

信用贷款评估模型研究
小组成员:王野 严梓凡 姚宇霄
背景介绍

• 随着我国经济的快速增长,人们对于资金的需求越来越大,相关
的贷款业务也水涨船高,尤其是信用贷款。信用贷款指的是以借
款人的信誉为担保发放的贷款。此类贷款方式的优势是借贷人无
需货物抵押,仅凭征信记录就可以快速获得一笔额度。但是由于
无需货物抵押,也给各机构造成了极大的压力,因此需要设计恰
当的算法模型,用机器代替人工,对申请人的材料进行快速准确
的分析。
本研究创新点

• 本研究的创新点在于将个人信用评估和人工智能相结合,基于已
知的信贷数据集,利用感知机机器学习算法来构建信用评估模型
,然后利用该模型对个人信用状况进行评估,由此提高预测准确
度和及时性
研究总流程

• 研究总流程分为两个部分:个人信用评估模型的构建和新样本的
预测分析
• ( 1 )模型构建:从已有数据集出发,结合感知机机器学习算法
,构建出个人信用评估模型
• ( 2 )新样本分析预测:系统自动封装获得的新的借贷人的数据
,然后将数据输入到已有的评估模型中,然后获得结果并得出结

训练数据集介绍

• 本研究训练数据集是德国居民的信用贷款申请材料数据集,来自
网站 UC Irvine Machine Learning Repository.
• 在该数据集中,含有 1000 个受测人样本,每个样本含有 20 项特
征( 13 项类别特征, 7 项数值特征),该数据集用以判断受测人
是否符合发放贷款的要求,其中 0 表示信用评估不符合要求, 1
则表示信用评估符合要求。
感知机算法介绍

• 感知机是二类分类的线性分类模型,其输入为实例的特征变量,
输出为实例的类别,取 +1 和 -1 二值。感知机对应于输入空间
(特征空间)中将实例划分为正负两类的分离超平面,属于判别
模型。该超平面确定了效果最好的感知机模型
感知机模型的构建

• 感知机模型对应一个 n 维特征空间的超平面 w*x + b=0 ,感知机


模型即决策函数为 f(x)=sign(w*x + b)[ 其中 sign(x) 为符号函
数, w 和 b 是感知机模型参数, w 为权值向量, b 为偏置。
损失函数

• 本研究所选用的损失函数为 n 维特征空间中所有误分类点到超平
面 S 的总距离,用以衡量感知机模型对应的超平面分类失败的程
度,其中误分类点表达公式为: y(w*x + b)<0. 由此可得,损失
函数的公式为 L(w , b)=-∑y(w*x + b)
损失函数的最小化

• 本研究利用梯度下降对损失函数进行最小化,最小化损失函数的
公式为:
• (w , b)= arg min L(w,b)
• 当 L(w,b) 取最小值时,( w,b )可以确定一个最好的超平面,
从而得到一个最好的感知器模型。
梯度下降

•  梯度下降法是一种迭代方法,通过不断改变 w 和 b 的值,使得损
失函数变得越来越小,直到损失函数取最小值为止
• 损失函数的梯度公式:∑ y
• x*y
梯度下降

•• 由上一张幻灯片中的公式求出损失函数的梯度方向向量
  (-∑xiyi,-∑yi), 损失函
数下降最快的方向为负梯度方向 (∑xiyi,∑yi)
• 利用该负梯度方向对 w 和 b 进行迭代更新,更新公式为:
• w←w+yixi
• b←b+yi
• 参数学习率,其随着迭代次数增加而减少
• 之后不断重复梯度下降过程,直到该训练集中误分类点个数低于阈值为止,最后把
更新后的 w 和 b 带入 f(x)=sign(w*x+b) 中得到最好的感知机模型。
模型评估

• 本研究采用的是交叉验证法,即在给定的建模样本中,拿出大部
分样本进行建模型,留小部分样本用刚建立的模型进行预报,并
求这小部分样本的预报误差,记录他们的平方加和。
• 在研究中,将已有个人信用数据集按 70% 和 30% 比例分成训练集
和测试集两部分,训练集用于训练模型,测试集用于检验模型准
确率
利用模型对个人信用情况进行预测

• 收集受测人关于个人信用的指标特征,将特征向量传入信用评估
模型中,经过模型计算求得受测人的个人信用标签 y ,从而得出
结论是否发放贷款。
谢谢聆听

You might also like