风控模型黑箱可解释，试下这个方法来演示

模型的开发，目前在互金领域场景中因为变量多，开发周期短，目前用得最多的就是XGB、LGB这类的机器学习模型。

比如我们之前跟大家输出的关于个人信贷反欺诈评分卡的开发内容里，我们用的就是lightgbm来建模的，相关的操作细节如下：

编辑切换为居中

添加图片注释，不超过 140 字（可选）

编辑切换为居中

添加图片注释，不超过 140 字（可选）

关于这一类机器学习模型，虽然说有黑箱的内容在里面，但常规上我们还是可以用特征重要性，也就是feature_importance来查看特征对模型重要度的贡献：

编辑切换为居中

添加图片注释，不超过 140 字（可选）

【图：绘制lgb模型的特征重要性的排序图】

关于模型特征可解释性的的内容，除了如以上提供的模型都有importance这一接口外，目前常用的还有SHAP这一个模型可解释性的内容，今天我们跟大家讲讲这个内容，而且还会实操一个只能用SHAP来演绎模型特征重要性的算法。

一.SHAP介绍

可解释机器学习在这几年慢慢成为了机器学习的重要研究方向。作为数据科学家需要防止模型存在偏见，且帮助决策者理解如何正确地使用我们的模型。越是严苛的场景，越需要模型提供证明它们是如何运作且避免错误的证据

关于模型解释性，除了线性模型和决策树这种天生就有很好解释性的模型意外，sklean中有很多模型都有importance这一接口，可以查看特征的重要性。如这里提到的特征重要性的内容：

编辑切换为居中

添加图片注释，不超过 140 字（可选）

关于特征的重要性，比如上面我们用xgboost这种集成模型时是用feature_importance方法的。那对于某些算法，比如异常检测中的孤立森林算法，只能用shap value来表达。

二.如何实现SHAP

实现SHAP，可以直接调用SHAP模块就能实现。本次在实操过程中，我们用之前跟大家介绍过的孤立森林这个算法，来特别实现，因为孤立森林接口直接调不出feature_importance的。

如上所述，shap是Python开发的一个"模型解释"包，可以解释任何机器学习模型的输出。其名称来源于SHapley Additive exPlanation，在合作博弈论的启发下shap构建一个加性的解释模型，所有的特征都视为“贡献者”。对于每个预测样本，模型都产生一个预测值，shap value就是该样本中每个特征所分配到的数值。

编辑切换为居中

添加图片注释，不超过 140 字（可选）

Python中shap值的计算由shap这个package实现，下面我们对训练出的base_iforest模型，计算其shap值。先引用package并且获得解释器explainer，再获取各个样本的shap值，然后调用summary_plot绘制重要性排序图，可以看到绘制出的图表类似xgboost的feature_importance图，shap value可理解为一个特征对目标变量影响程度的绝对值的均值作为这个特征的重要性。

编辑切换为居中

添加图片注释，不超过 140 字（可选）

编辑切换为居中

添加图片注释，不超过 140 字（可选）

关于本文所提及的机器学习模型相关的数据集跟代码实操内容，可以同步至知识星球后台，查看完整版本内容，欢迎星球同学移步到知识星球查收完整内容：

编辑切换为居中

添加图片注释，不超过 140 字（可选）

...

~原创文章

展开阅读全文

页面更新：2024-05-09

标签：模型解释性黑箱注释算法演示重要性特征机器编辑内容可解释图片

1 2 3 4 5

风控模型黑箱可解释，试下这个方法来演示

「央广时评」共绘科技创新蓝图提升美好生活体验

造车新势力公布8月销量，后来者居上

柴油：9月2日全国柴油价格

十年来原材料工业增加值年均增长4.5% 迈入由大到强新发展阶段

又一电商企业被查！连补带罚467万，电商企业如何做好财税合规？

9月2日茅台行情价

“2022运营商省公司百强榜”已推出云南电信位居第53名

拿什么拯救你？北方城市经济的落寞

总理点名后，勇挑大梁的山东收到重磅大礼包

房产税还没来，这项税费却来了，最高20%，3个省份开始试点

油价调整消息：今天9月2号，加油站调价后92、95、98汽油售价

麻了？2家银行破产，储户波澜不惊！百姓已经习惯了

“停工令”来了？化工企业发展“遇阻”，千万职工何去何从？

“农村信用社”，和“邮政储蓄银行”，现在还有人去存钱吗？

月光，在一朵花里打湿

优质视图编辑APP合集

幼儿园中班育儿知识内容

法国心理学家发现：孩子小时候具备这3点特征，很可能是一

基于AI算法的数据库异常监测系统的设计与实现

扫地机器人：努力从“能用”变“好用”

一个模型搞定元素周期表常见元素：分子模拟模型最高省90

国产机器人出海，瞄向欧美后花园 - 甲子发现

你是否还记得快播？由于淫秽内容而灭亡，CEO被判入狱

小米炒菜机器人上市预定减1000

射击新旗舰大作《使命召唤：现代战争2》包含了一些限制