机器学习中的数据经常有标注错误,不准确,不一致或者模糊的情况,这样的脏数据会误导训练模型的训练。cleanlab可以自动发现并修复任何ML数据集中的错误,在训练期间提供干净的标签。为以数据为中心的 AI 提供了标准框架。
开源:https://github.com/cleanlab/cleanlab
网站:https://cleanlab.ai
修复样例体验:https://labelerrors.com
安装非常简单
pip install cleanlab
样例代码
from cleanlab.filter import find_label_issues
ordered_label_issues = find_label_issues(
labels=labels,
pred_probs=pred_probs,
return_indices_ranked_by='self_confidence',
)
页面更新:2024-03-09
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号