5分钟重点:浅谈金融领域的智能风控平台


金融是产业的催化器,也是快速发展必不可少的力量。据称,现代银行业的第一家银行是意大利的那不勒斯银行,它成立于1472年。我国古老的借贷业务,最早也可以追溯到2千多年前的战国时代。随着社会的发展,科技创新的力量不断推动产业升级。现代金融业,也从传统的以人工为主的风控审批模式,转变为智能风控模式。本文,我将回顾自身在金融科技领域的产品工作,结合人工智能时代的发展脉络,一起来探讨下智能风控。

一、智能风控诞生的契机

过去几年,金融科技化成为社会的关注点,金融与科技相互融合,创造出新的业务模式、应用、流程和产品,催生出新的客户关系,对金融机构、金融市场、金融服务产生了深刻影响。

金融科技的发展离不开底层技术的发展,而大数据、人工智能则作为新一轮科技革命和产业变革的重要驱动力量;在金融科技化的过程中发挥着无可替代的作用。在可预测的未来,随着人工智能技术与金融业深度融合,用机器替代和超越人类部分经营管理的能力将获得进一步加强,或将触发一系列的变革。

金融活动中,无论是信贷、消费金融;还是供应链金融、商业保理等模式。对于金融机构来说,风控是关键,债务偿还能力覆盖风险是第一要务,也是银行机构良性发展的基石。金融借贷,作为金融机构重要收支来源,靠人工风控的模式,存在审批时间长、人为决策难、数据分析难等问题。这明显满足不了机构和社会需求。这也是促使风控从人工走向智能化的主要推动力。而金融业的智能风控是一种采用人工智能和大数据技术,结合金融行业的风控理论和实践,以提高企业风险管理效率和质量的新型风险管理技术。它主要利用机器学习、大数据分析、模式识别等技术,对金融行业的风险进行深入分析,实现风险的预测和预警,从而提高企业的风险管理水平。

二、智能金融风控平台架构

智能金融风控平台架构图

上图是典型的智能金融风控平台架构,对于了解智能风控的应用场景,可以有个基础的印象。整个架构分为五层,分别是元数据层、大数据平台层、执行层、软件层、应用层。其中最底层是风控数据源的抽取。

三、风控平台要点:元数据

元数据层(数据源):从各个数据源,收集用户及资产相关的数据,整个数据源的获取类型,数据范围,一般与金融机构的风控政策相关。对于金融机构来说,为方便展业,前端销售部门都会包装成易于客户理解的金融产品(某白条、某消费分期、某车位贷、某彩礼贷)。再为这些金融产品,设立不同的进件准入条件(客户信息、抵押物、负债、收入证明等偿还能力证明),约定还款方式(等额本息、等额本金、先息后本)、利率和期数。

对于风控部门来说,为了识别风险、规避风险、减少贷后坏账的产生。将客户偿还能力的进行准确评估是重点。而客户资信数据化、数据来源多样化、零散化一直是阻碍风控部门快速决策的阻碍。也是前端金融客户经理和风控部门利益纠结点。而借助科技的力量,我们将风控的数据源采集分为内部时候和外部数据。

内部数据:交易数据、用户行为数据、账号数据、设备指纹、授信记录、还款记录、黑名单。

外部数据:第三方风控、名单库数据、运营商数据、身份信息、社交关系、学习、App操作行为、征信数据。

外部数据,一般都是要花钱买的。数据源多且杂,但数据或多或少都有作用,在对接第三方数据平台或API厂商时,就需要衡量数据价值性。当然数据采集,也会碰到数据合规性和数据隐私问题。比如用户社交关系,运营商等数据的来源是否合规,合法,个人数据采集是否涉及侵犯用户隐私等。

四、风控平台要点:大数据层

大数据平台:不同的数据源,数据结构和来源方式均不同。我们需要通过实时或离线的方式进行采集,并集成到大数据平台,进行统一的存储与加工、计算。而大数据平台架构本身是比较成熟的,在金融大数据构建中,一般的要点在于实时性和数据治理。首先,因为用户申请贷款,要线上实时审批,所以要保证计算的效率。而金融数据来源多,数据脏,要做大量加工和清洗,并且在数据使用过程中要效率高、稳定、灵活。

五、风控平台要点:大数据模型算法

执行层:包括风控数据模型服务、决策引擎服务、智能算法库。

决策引擎:决策引擎一套产品驱动型的模型算法服务,现有的决策引擎,历经发展,已经可以对不同的金额产品,设立不同的规则,再设立任务进行驱动和调度。并引入机器学习算法,智能的去做数据加工、监控。决策引擎,底层是应用一些算法,比如决策树、决策森林进行数据规则匹配。而商业化应用,则是引入规则引擎,市面上有比较多的开源规则引擎,比如Drools、JLisa、QlExpress等。其中Drools是一款基于Java语言的开源规则引擎,基于RETE算法实现。在风控审批中,如某个金融产品的准入条件,需要月收入大于2万,已婚且有房产。则可以将上述条件配置为规则,进行驱动实现决策。

外接规则引擎API服务架构

风控模型与算法库:在金融风控数据建模时,根据数据源、数据结构的不同,会应用到一系列的算法。比如需要进行数据抽样时,会用到随机抽样、bootstrap抽样、gibbs抽样算法。对于结构化数据,会用到无监督学习(客户聚类、协同过滤、对应分析)、有监督学习(逻辑回归、决策树、SVM、贝尔斯)、序列分析(时间序列)、自适应模型(神经网络、深度学习)、最优化算法(EM、线性规划)等。对于非结构化数据,会用到文本分析、语义分析、主题分析、圈子分析等算法。比如在金融信贷风控中,常见的评分卡模型,底层算法就是逻辑回归(Logistic Regression,LR)。

金融评分卡模型

六、风控平台应用场景

本文的最后,我们回归应用场景,毕竟所有数据,算法,平台均是为了场景服务的。由于金融活动中,风控的重要性,金融风控需要覆盖到贷前、贷中、贷后整个生命周期的。从用户运营角度来看,则需要覆盖多个阶段。

1、获客阶段,获客常有多个渠道,如去某平台投流,获取的客户,风控需要调用基础的规则,进行筛选客户(例如行业黑名单)。

2、注册阶段,收集客户信息,风控进行活体识别(例如人脸验证,防机器人注册)

3、申请阶段,进行贷款预审,风控设立注入门槛,反欺诈,基础信用评估(例如资料包装,地域骗贷)

4、贷中阶段,监督跟踪客户风险,进行客户逾期预警,客户流失预警。

5、贷后阶段,回款数据,催收管理。

部分资料来源:DataFun、CSDN

展开阅读全文

页面更新:2024-04-29

标签:智能   金融   平台   数据源   算法   规则   风险   重点   领域   客户   引擎   数据

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top