百川大模型,是百川智能公司成立后发布的第一个大模型,也是该公司的一次重要的尝试和探索。
该公司由搜狗创始人王小川于2023年4月成立,致力于打造一个开放的AI平台,为用户提供高质量的AI服务。
Baichuan-13B大模型是由百川智能公司于2023年7月11日推出的一个开源可商用的中英文预训练语言模型,参数量为130亿。
模型地址和源码地址见文末
它基于Transformer结构,在大约1.4万亿tokens上训练,支持中英双语,上下文窗口长度为40962。它在多个中文和英文权威评测榜单上都取得了同尺寸最好的效果。
它是目前最大的开源中英文预训练语言模型,覆盖了多种领域和场景的语料,具有强大的通用性和适应性。
它不仅对学术研究完全开放,所有开发者均可通过邮件向百川智能申请授权,在获得官方商用许可后即可免费商用。
申请邮箱:opensource@baichuan-inc.com。
Baichuan-13B-Base地址:
https://modelscope.cn/models/Baichuan-inc/Baichuan-13B-Base/summary
Baichuan-13B-Chat地址:
https://modelscope.cn/models/baichuan-inc/Baichuan-13B-Chat/summary
开源地址:
https://github.com/baichuan-inc/Baichuan-13B
页面更新:2024-03-07
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号