中文通用大模型基准测试 SuperCLUE 发布，讯飞星火认知大模型国内第一

节点财经 • 2023年 5月 10日 11:47 • 上市公司 • 阅读 5656

5月9日，中文通用大模型综合性评测基准 SuperCLUE 正式发布。该基准测试主要关注以下问题：中文大模型在不同任务上的表现如何？与国际代表性模型相比，中文大模型的表现达到了何种程度？中文大模型与人类表现相比如何？

该模型可通过多个层面，考验市面上主流的中文 GPT 大模型的能力：

基础能力: 包括了常见的有代表性的模型能力，如语义理解、对话、逻辑推理、角色模拟、代码、生成与创作等 10 项能力。

专业能力: 包括了中学、大学与专业考试，涵盖了从数学、物理、地理到社会科学等 50 多项能力。

中文特性能力: 针对有中文特点的任务，包括了中文成语、诗歌、文学、字形等 10 项多种能力。

中文通用大模型基准测试 SuperCLUE 发布，讯飞星火认知大模型国内第一

该机构利用 SuperCLUE 测试基准，对市面上主流的支持中文的通用大模型进行了评测与排名。从排名中我们可以看出，GPT-4 一骑绝尘，已经非常接近人类的能力。国产大模型中讯飞科技研发的星火认知大模型总排名第三，国内排名第一。

中文通用大模型基准测试 SuperCLUE 发布，讯飞星火认知大模型国内第一

以下为该机构公布的各个子项目的具体得分。排行榜会定期更新，并于CLUEbenchmarks 官方网站网站进行公示。

中文通用大模型基准测试 SuperCLUE 发布，讯飞星火认知大模型国内第一

中文通用大模型基准测试 SuperCLUE 发布，讯飞星火认知大模型国内第一

中文通用大模型基准测试 SuperCLUE 发布，讯飞星火认知大模型国内第一

节点声明：本内容为作者独立观点，不代表节点财经立场。未经允许不得转载，文中内容仅供参考，不作为实际操作建议，交易风险自担。

赞 (0)

0

新城控股4月合同销售额同比降20.67%；阅文集团管理层调整

新城控股4月合同销售额同比降20.67%；阅文集团管理层调整

上一篇 2023年 5月 10日 11:10

视觉中国实控人柴继军减持203万股；淘宝天猫集团架构调整完成

视觉中国实控人柴继军减持203万股；淘宝天猫集团架构调整完成

下一篇 2023年 5月 11日 10:44

上市公司

45年前的那场激烈争论，为什么厉以宁坚持的股份制改革这么重要？

关键在于如何对待，“心宽无处不桃源”。

财经无忌
2023年 3月 1日
上市公司

修一次赚三次，啄木鸟维修「围猎」年轻人

文 / 二风来源 / 节点财经 3月15日晚，央视“3·15晚会”曝光了维修服务平台「啄木鸟家庭维修」（以下简称‘啄木鸟’）的维修乱象。央视记者调查表明，啄木鸟存在严重高价维修、对维修师抽成比例过高等系列问题。在3·15晚会曝光后，重庆市场监督管理局执法总队执法人员，会同两江新区市场监管局执法人员迅速抵达啄木鸟家庭维修办公地点，立即开展调查…

节点财经
2025年 3月 16日
上市公司

确认！朱炳仁铜董事长朱军岷将出席2026节点增长大会！

送别2025，眺望2026。 AI已然褪去早期的燥热与科幻滤镜，露出了作为“新基础设施”的坚硬内核。我们看到，大模型不再仅仅停留于对话的惊艳，而是化身AI Agent（智能体）潜入企业的业务流，能够自主决策、执行任务；我们看到，具身智能打破了虚拟与现实的界限，人形机器人开始走出实验室，探索物理世界的交互；更重要的是，我们看到了“应用”的爆发——AI正以…

节点财经
2025年 12月 9日
上市公司

蜜雪冰城上市，一场供应链的资本化试验？

文 / 三生来源 / 节点财经 2025年3月3日，蜜雪冰城（证券简称“蜜雪集团”02097.HK）以每股202.5港元的发行价登陆港交所，募资总额34.55亿港元，当日收报290港元/股，大涨43.21%，总市值达1093.47亿港元，成为全球现制饮品行业市值最高的企业。这家以“4元的柠檬水、8元的奶茶”横扫下沉市场的新茶饮代表…

节点财经
2025年 3月 4日
上市公司

地平线机器人-W周年答卷：以技术引领与生态布局，构建宽阔护城河

2025年四季度智驾赛道热度持续攀升，行业竞争逐步聚焦于技术商业化落地速度与全球化布局进展。作为国内智驾科技领军企业，地平线机器人-W（9660.HK，以下简称“地平线”）再次成为行业瞩目的焦点：根据Counterpoint Research数据，地平线成为2025年全球前五大智驾芯片厂商，已然全球智驾行业不可忽视的中国力量。恰逢一周年之际，地平线也传来多…

节点财经
2025年 10月 24日