清华大学发布3月份大模型评测报告，文心一言4.0表现亮眼

日前，由清华大学基础模型研究中心联合中关村实验室研制的SuperBench大模型综合能力评测框架，正式对外发布2024年3月版《SuperBench大模型综合能力评测报告》。评测共包含了14个在海内外具有代表性的模型，结果显示：文心一言4.0表现亮眼，与国际一流模型水平接近，且差距已经逐渐缩小。

在人类对齐能力评测中，文心一言4.0表现优异，位居国内第一。其中，在中文推理、中文语言等评测上，文心一言遥遥领先，和其他模型拉开明显差距；中文理解能力方面，文心一言4.0领先优势明显，领先第二名GLM-4 0.41分，GPT-4系列模型排在中下游，并且和第一名文心一言4.0的得分差超过1分。

在语义理解中的数学能力上，文心一言4.0与Claude-3并列全球第一；GPT-4系列模型位列第四五位，其他模型得分在55分附近较为集中；而在语义理解中的阅读理解能力上，文心一言4.0超过GPT-4Turbo、Claude-3以及GLM-4拿下榜首。

在企业选择大模型最看重的安全性评测上，文心一言4.0表现亮眼，力压国际一流模型GPT-4系列模型和Claude-3。

文心一言不仅技术能力过硬，在应用落地上也是一路领先。自去年3月16日文心一言首发至今，用户数已突破2亿，每天API调用量也突破了2亿。

上游新闻杨昕华

展开阅读全文

页面更新：2024-04-24

标签：清华大学模型日文中下游语义中文得分差距能力系列

首都机场T3D提升项目获批，未来可实现国内国际航班廊桥切换

新京报讯（记者吴婷婷）4月23日，国航宣布即将新开及复航4条国际航线。在当日举行的新闻发布会上，首都机场集团副总经理韩志亮介绍，首都机场将实施T3航站楼提质增效项目，其中包括将T3D打造成为国际国内航班廊桥可切换、旅客同

济南-曼谷航线航班加密至每周7班

齐鲁网·闪电新闻4月23日讯4月23日起，济南机场加密“济南-曼谷”往返航线航班，频次由原每周4班往返增至每周7班往返，每日执飞一班。该航线由泰国狮子航空执飞，采用波音737-800执飞，最大承载旅客185人。去程航班号SL961，23时

雷军：始终在关注手机业务，投入大概三分之一精力

4月23日，雷军在小米集团投资者大会上表示，在汽车业务上投入一半精力的同时，他还始终在关注手机业务，投入大概1/3的精力。雷军表示，“因为手机业务是我们安身立命之本，目前卢总（卢伟冰）、曾总（曾学忠）等高管都花了大量时间，做的非

已经消失的24个电子设备，你都用过几个？全是回忆

在民国时期的某个古镇，夕阳西下，余晖洒满青石板路，斑驳的光影在古色古香的建筑上跳跃。我漫步于这充满历史韵味的小巷，心中涌起一股怀旧之情。那些已经消失的电子设备，如今在我脑海中一一浮现，仿佛又回到了那个充满变革与回

国航将新开及复航4条国际航线，欧洲航线运力已超2019年

新京报讯（记者吴婷婷）自4月28日起，中国国际航空将陆续新开北京-利雅得、北京-达卡航线，复航北京-马德里-圣保罗、北京-马德里-哈瓦那航线，届时国航航线网络将重新覆盖至全球六大洲。国航将新开及复航4条国际航线，航线网络将

《三体》重要情节被验证？中国科学家首次观测到

小说《三体》中，主人公意外掌握了一种特殊的电磁信号传输方法，于是她用太阳作为信号放大器，以“恒星级”的传输功率向宇宙打出了人类文明的第一个“招呼”。这种操作是否真的存在可行性？近期，哈尔滨工业大学（深圳）空间科学与

闹大了！中国电信突然宣布“坏消息”，4G用户：5G再见！

近日，中国电信在微博突然发布公告称将升级部分4G网络设备，意外中有部分老式4G手机将无法使用上网。这一消息一出，立即在网上引发热议。作为国内第一家建立4G网络的电信运营商，中国电信在推进5G建设的同时，也面临着升级和淘

一夜蒸发上亿市值！7亿人都救不了拼多多？网友直呼：自作自受！

本文陈述所有内容皆有可靠信息来源赘述在文章结尾前言“拼多多，拼得多，免得多，拼就要拼多多，随时随地拼多多”，拼多多这句广告语宛如洗脑神曲，在人们脑海里挥之不去。但谁能想到，前两年风光无限的拼多多在本月初却惨遭滑铁卢

最有资格担任神舟十八号指令长的不二人选！航天英雄翟志刚！

说实话,我一直很想亲口问问那位"航天英雄"翟志刚,当年他是怎么想的?在那一个个关键时刻,他的内心究竟在想些什么?后来我明白了,翟志刚这个人啊,他从来就不是个啰嗦的家伙。你要他说说心里话,他宁可让你一辈子猜下去。

中国互联网奔涌 30 年！QQ 也 25 岁了

30 年前，一条 64K 的国际专线，从中科院计算机网络信息中心出发连接世界，中国互联网时代从此开启。4 月 20 日，是中国互联网 30 周岁生日。这一天，多名互联网大佬齐聚一堂。360 创始人周鸿祎，兴奋地连发多条视频和图文，收割了

蜂助手：公司产品在快手、抖音、拼多多等平台推广，目前没有智能AI助手辅助

金融界4月22日消息，有投资者在互动平台向蜂助手提问：媒体报导，拼多多蜂助手是一款由蜂助手公司的拼多多店群管理软件，请问这是一款智能AI助手吗？有没有在其他平台也有类似的软件，目前推广情况如何？公司回答表示：公司希望借助

小米：2024年小米su7交付目标超过10万辆

每经AI快讯，小米集团总裁、小米品牌总经理卢伟冰发文称，“雷总宣布，2024年小米su7交付目标超过10万辆。”每日经济新闻

文旅夜游经济火了，这家视效科技公司今年想赚到十个亿

“2024年集团的发展重点包括，全面推进文旅夜游业务和AI空间计算创新业态的发展，以AI空间计算技术创新，打造更多具有创新性和竞争力的文旅产品。”利亚德集团董事长兼总裁李军，在4月17日2024年生态合作伙伴大会暨年度战略

斗鱼创始人、头部主播再上热搜背后：市值蒸发九成，营收大降

4月23日，知名主播“PDD”“一条小团团”等词条快速冲上了热搜，与这些词条一同出现在热搜上的，还有“大批斗鱼头部主播停播”“一条小团团确认被捕”等词条。此前有媒体报道称，斗鱼创始人兼CEO陈少杰已于今年春节后取保候

三只羊巨变：小黄出走，大杨哥除名，未来何去何从？

文小one编辑小one前言三只羊，曾经风靡网络的直播带货团队，如今却陷入巨变之中。小黄的出走，大杨哥的除名，让三只羊的未来蒙上了一层阴影。三只羊的辉煌与争议三只羊凭借着幽默风趣的直播风格和低廉的价格，迅速走红网络，成

上滑加载更多 ↓

推荐阅读：

盘龙区新迎一幼第三分园开展读书月系列活动

湖南双牌推荐4条精品旅游路线 “5+16”系列活动等你来

基因骗不了人！把这6个星二代放一起看，颜值差距一目了然

本市自然科学研究系列科技传播专业高级职称申报进行中

TCL Q10K系列评测—超越竞争对手的性能与价格战略分析

我对刚发布的典藏级Mini LED电视TCL Q10K 系列的初印

华为Pura70系列哪个最值得买？ 3分钟给你答案

BALLY 2024 春夏系列预览于沈阳万象城精品店焕新呈现

CBA季后赛复杂局面考验裁判控场能力

亚奥理事会总干事、世界泳联主席侯赛因：广州有能力承办

友情链接：

更多：

本站资料均由网友自行发布提供，仅用于学习交流。如有版权问题，请与我联系，QQ：4156828

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top