全球首个粤语动态评测平台推出

10月30日,全球首个专为粤语而设的动态评测平台及生态系统CLEVA-Cantonese推出。凤凰卫视旗下人工智能数据服务机构——凤凰智媒为其提供了第一批高质量粤语数据。这个创新平台通过提供公平、动态且具参考价值的基准评估,揭示各类大语言模型对粤语的支持程度,并为研究人员及开发者提供具参考价值的分析,加速粤语大语言模型的优化及实际应用。

此前,港中大语言与视觉实验室研发的CLEVA是目前公认规模最大、涵盖最全面的中文大语言模型评估基准之一。CLEVA-Cantonese在此基础上,建立全球首个持续演进的粤语大语言模型评估生态系统。

粤语是香港、广东及海外华人生活地区的重要语言,但由于粤语语音语义的繁复多样、口语和文字的巨大差异、以及独特的文化背景等原因造成大模型对粤语的理解和支持能力较为欠缺。同时,粤语是低资源语言,语料库有限,所以收集更多高质量的数据,是提升大模型能力的基础条件。

展开阅读全文

更新时间:2025-11-04

标签:科技   粤语   动态   全球   平台   语言   模型   数据   基准   生态系统   语料库   能力   价值

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By bs178.com 闽ICP备11008920号
闽公网安备35020302034844号

Top