A Data Cartography based MixUp for Pre-trained Language Models

MixUp MixUp 是一种数据增强策略，其中通过组合训练样本的随机对及其标签在训练期间生成额外的样本。但是，选择随机对可能不是最佳选择。在这项工作中，我们提出了 TDMixUp，这是一种新颖的 MixUp 策略，它利用 TrainingDynamics 并允许组合更多信息样本以生成新数据样本。我们提出的 TDMixUp 首先测量置信度、可变性（Swayamdipta 等人，2020）和边际下面积（AUM）（Pleiss 等人，2020），以识别训练样本的特征（例如，易于学习或模棱两可的样本），然后对这些特征样本进行插值。我们凭经验验证，与强基线相比，我们的方法不仅使用较小的训练数据子集实现了有竞争力的性能，而且在域内和域外设置上的预训练语言模型 BERT 上产生了更低的预期校准误差在广泛的 NLP 任务中。我们公开发布我们的代码。

《A Data Cartography based MixUp for Pre-trained Language Models》

论文地址:http://arxiv.org/abs/2205.03403v1

展开阅读全文

页面更新：2024-05-05

标签：可变性基线组合子集模棱两可域外样本特征策略数据

1 2 3 4 5

A Data Cartography based MixUp for Pre-trained Language Models

中国科技行业大周期预期

腾讯与国美达成战略合作加速推动全零售生态共享平台建设

厉害！福建高校科研团队找到自动驾驶设备“新大脑”

临时股东大会存争议 ST曙光转型新能源汽车

好玩的表情包机器人小程序源码_支持直接搜索仿聊天界面获取源码

科学家找到重新激活可充电锂电池并将寿命提升30%的新方法

北京24小时保供战：互联网抢菜大考

高合暗藏“偷窥神器”，智能汽车岂是法外之地？

轴距2米7的小巧低价代步车，不烧油长续航带快充，实拍比亚迪海豚

奇瑞开窍了，小车玩得花样百出，把QQ造得像坦克300一样

电力设备与新能源行业：新基建、新格局、新技术驱动行业新成长

时代变了？年轻人开始流行提前还房贷了

全国油价调整信息：5月10日调整后：92、95号汽油价格表

芯片需求下降，中国产业需要加大投资，拖垮竞争对手

网友：房价从1.4万降9000元，工资减半，现在好害怕断供

中国篮坛兄弟组合知多少？15岁双胞胎兄弟天赋异禀，未来不

40岁还“老得慢”的女人，皮肤大多有这3个特征，你中了几

年轻人为何突然爱上带手表？唯品会一则数据揭开谜底

多晶氧化锌：Al薄膜上蚀刻特征演化的观察

1分钟就懂！教你快速迁移旧手机数据一步到位不用调

魅族5500mAh新机高调爆发，定名“魅族19s”，放弃高价策略

“灯泡”组合悲喜两重天！哈登如愿战胜心魔，保罗面临魔咒

女性变老的4个特征，一个不占为好，日常做好3件事，帮助延缓

除了帮你监控手机温度，微信还想要其他数据

30省份公布的人口大数据，透露了哪些信息？