产品动态

在这里,你可以看到聚信立每天发生的点点滴滴。

风控数据新来源,聚信立AI图灵挑战相关度测评

2019-05-13

重点:

图灵分与芝麻信用分的相关度为 2%
图灵分与社交信用分的相关度为 0.2%
图灵分与多头借贷分的相关度为 0.7%

早年间,借款人在申请贷款时,金融机构多是依据央行的征信系统来获取个人信用状况,但央行征信系统多是整合的银行信贷类数据,其覆盖人群也只占全国人口的65%-70%,以此作为信贷风控的参考依据是不健全、不完整的。

后来互联网的发展产生了大量的数据记录,云计算为大数据的获取挖掘提供了技术支持,一系列信息技术的发展对于完善我国现行市场的风控体系、实现普惠金融提供了强有力的帮助。

互联网发展至今,其所产生的数据类型越来越庞大,在取得授权的前提下,可搜集获取的数据源包括电商类、社交类、消费类、运营商类、网络行为类等等,也由此出现了一些针对性的信用评分类产品或平台,如51信用卡,主要基于用户信用卡电子账单的历史数据,交叉验证电商以及社交关系数据,判断用户的风险等级;再如基于QQ、微信、腾讯网、财付通等社交网络的腾讯信用,依据用户的即时通信、虚拟消费、电商交易、游戏行为等画像数据,得出基于互联网行为的个人信用报告……

芝麻信用

以芝麻信用为例,了解一下市面上传统风控产品的信用评分模型。

芝麻信用是参考美国官方的信用评分体系“FICO”,综合考虑了用户的身份特征、信用历史、履约能力、人脉关系以及行为偏好五个大类,加工、整理、计算后得出用户信用评分,分值越高代表用户的信用水平越好。

身份特征:指用户的姓名、年龄、职业、收入等基础信息,及工商、法院、学历学籍等公共部门的有效数据。

信用历史:过往发生的债务活动,尤指在支付宝上的信用账户历史、转账以及还款等情况。

履约能力:用户在各种信用服务中的履约表现情况,例如通过关联平台租借的共享产品是否按时归还。

人脉关系:社交网络中好友的身份特征、信用等级及互动频率等,作为评判个人信用等级的依据,但目前社交的聊天内容等还未纳入参考。

行为偏好:在购物、消费等方面表现出来的具象的行为习惯,带有明显的特征偏好。

芝麻信用的数据主要来源于其所处的行业领域,“阿里体系”内的数据是信息获取的主要渠道,正如前文所述的51信用卡、腾讯信用等,数据获取渠道及评分维度几乎是市场上现有风控产品的架构基础,越来越趋同的风控产品该怎样进一步完善金融市场的风控体系,填补数据获取的缝隙?

AI图灵

AI图灵是聚信立基于人工智能技术研发的一款全新的数据获取及模型优化的评分工具。它通过获取用户的授权后扫描用户的图片,识别出图片中的风景、地点、同框人物、场景、商标、文字等信息,从中提取借贷、逾期、股票、赌博、不良嗜好等风险因子,从用户画像、偏好、事件、风险等维度打上标签,再综合上万个细分字段,基于随机森林+逻辑回归算法,经过数据清洗,特征选择,模型训练及参数优化,模型评估,最终生成用户的信用分。

首先,AI图灵创造性地开辟出了风控数据的新来源。不同于市场上现有产品的电商数据、运营商数据、社交数据等,它基于用户的图片数据,可以是社交软件的相册图片,可以是云盘/网盘存储的图片,可以是用户的本地相册,实现了对非结构化数据的获取应用,同时保证了数据的真实性和客观性,不会存在“刷信用”的行为。

其次,AI图灵从图片中提取出的评估指标,不仅仅有常见的个人基础信息、行为偏好、消费习惯等信息,更多是侧重于风险相关的表现因素,部分指标如下:

相关度测评

1、综合分

以芝麻信用为代表,从综合分的角度和AI图灵进行相关度实测,其测评结果如下:

上图中可以看出,两者之间的相关度在 2% 左右,这就意味着两者之间的数据重合度很低,同为大数据下的风控产品,两者之间并不存在严重的同质化倾向。

2、单方面分

除综合分外,市场上的信用分还可以细分为社交网络分、多头借贷分等具有针对性的信用评分。AI图灵在综合分方面的低相关度,在单方面分方面的表现如何?为避免某些误解,在此将选择的社交网络分和多头借贷分的代表性产品在测评过程中隐去名字,直接用分的名字代替,以这两款产品来反映市场的平均情况。

如上图所示,AI图灵和市场上社交网络分的相关度在 0.2% 左右,和多头借贷分的相关度在 0.7%,这两个数值远低于和综合分的测评。这表明,即使在细分领域,AI图灵的数据源、模型评估指标等都比较新颖,和市场重合度很低,属于全新的角度。

聚信立的AI图灵可以说是开创了全新的数据来源,是现有风控市场上数据的补充和扩展。对于大数据风控而言,数据的量级、数据的有效性等都是衡量风控模型的必要指标,但是横向来看,数据的维度会是今后风控产品越来越难跨越的挑战,维度越丰富,画出的用户画像才能越清晰立体,对用户风险的判断才能越精确。

目前,基于深度学习的图灵分比早前版本基于机器学习的图灵分有显著提升,新版图灵分的KS有效值可达到 35%,近期将完成测试面向市场!

产品信息咨询:021-54890256,business_contact@juxinli.com