自动查找并修复ML数据集中的错误工具cleanlab

机器学习中的数据经常有标注错误,不准确,不一致或者模糊的情况,这样的脏数据会误导训练模型的训练。cleanlab可以自动发现并修复任何ML数据集中的错误,在训练期间提供干净的标签。为以数据为中心的 AI 提供了标准框架。

开源:https://github.com/cleanlab/cleanlab
网站:https://cleanlab.ai
修复样例体验:https://labelerrors.com

安装非常简单

pip install cleanlab

样例代码

from cleanlab.filter import find_label_issues

ordered_label_issues = find_label_issues(
    labels=labels,
    pred_probs=pred_probs,
    return_indices_ranked_by='self_confidence',
)
自动查找并修复ML数据集中的错误工具cleanlab

自动查找并修复ML数据集中的错误工具cleanlab

自动查找并修复ML数据集中的错误工具cleanlab

展开阅读全文

页面更新:2024-03-09

标签:错误   数据   框架   模型   模糊   干净   机器   情况   标签   代码   工具

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top