中文通用大模型基准测试 SuperCLUE 发布，讯飞星火认知大模型国内第一_IT_财经

时代财经 ·

05月10日

热度:

5月9日中文通用大模型综合性评测基准SuperCLUE正式发布该基准测试主要关注以下问题中文大模型在不同任务上的表现如何与国际代表性模型相比中文大模型的表现达到了何种程度中文大模型与人类表现相比如何该模型可通过多个层面考验市面上主流的中文G

5月9日，中文通用大模型综合性评测基准 SuperCLUE 正式发布。该基准测试主要关注以下问题：中文大模型在不同任务上的表现如何？与国际代表性模型相比，中文大模型的表现达到了何种程度？中文大模型与人类表现相比如何？

该模型可通过多个层面，考验市面上主流的中文 GPT 大模型的能力：

基础能力: 包括了常见的有代表性的模型能力，如语义理解、对话、逻辑推理、角色模拟、代码、生成与创作等 10 项能力。

专业能力: 包括了中学、大学与专业考试，涵盖了从数学、物理、地理到社会科学等 50 多项能力。

中文特性能力: 针对有中文特点的任务，包括了中文成语、诗歌、文学、字形等 10 项多种能力。

该机构利用 SuperCLUE 测试基准，对市面上主流的支持中文的通用大模型进行了评测与排名。从排名中我们可以看出，GPT-4 一骑绝尘，已经非常接近人类的能力。国产大模型中讯飞科技研发的星火认知大模型总排名第三，国内排名第一。

以下为该机构公布的各个子项目的具体得分。排行榜会定期更新，并于CLUEbenchmarks 官方网站进行公示。

标签：专业市面上代表性

你可能感兴趣的内容

京东零售云应邀出席中国零售创新大会与行业共话全域增长新路径_产业经济_财经

全球糖供需缺口正在扩大糖价开启"狂飙"模式_消费_财经

百洋医药一重要合作主体注销，再融资募资总额或再调整_产业经济_财经

9万投入产生200万GMV，京东云言犀智能外呼助力3C品牌高效增长_产业经济_财经

隆基绿能签下671亿元大单？多环节价格松动，光伏降价潮悄然开启

开年首月，经济大省“一把手”密集调研：去了哪，见了谁？

本文来源:

时代财经

原文标题: 中文通用大模型基准测试 SuperCLUE 发布，讯飞星火认知大模型国内第一_IT_财经

扫描下载APP

中文通用大模型基准测试 SuperCLUE 发布，讯飞星火认知大模型国内第一_IT_财经

你可能感兴趣的内容

时代财经

下一篇

广告合作

QQ：1745425720

手机：‭13119587361‬(同微信)

商务微信：13119587361 (添加时请备注)

投稿邮箱：1745425720@qq.com

栏目推荐

扫描下载APP

中文通用大模型基准测试 SuperCLUE 发布，讯飞星火认知大模型国内第一_IT_财经

你可能感兴趣的内容

时代财经

CFS2023杰出品牌形象奖：安路科技（688107）中高端转型成效渐显_商业要闻_财经

CNAS顺利通过亚太认可合作组织（APAC）国际同行评审_商业要闻_财经

方正证券第二届“方华杯”私募大赛6月赛果公布，绩优私募各展风采，载誉而归_商业要闻_财经

穿山甲一站式解决方案解密，三大细分赛道打法一文读懂_商业要闻_财经

新壹科技发布新壹视频大模型 数字人主持人成为关注焦点_商业要闻_财经

58汽车联合J.D. Power发布《中国汽车保值率风云榜》：中国品牌多点开花黑马频现_商业要闻_财经

UCloud优刻得AIGC图像产品即将亮相IXDC 2023国际体验设计大会_商业要闻_财经

做有温度的金融服务 度小满商家服务助手为小店“烟火气”赋能_商业要闻_财经

周大生开新大赏，原创数字人菲斯特引领珠宝营销新风向_商业要闻_财经

只有红楼梦·戏剧幻城：回到童年，做一场属于自己的“梦”_商业要闻_财经

即分期多措并举持续强化消费者权益保护工作，打造放心消费场景_商业要闻_财经

圣基茨和尼维斯宣布其投资移民项目重大政策更新_商业要闻_财经

下一篇

广告合作

QQ：1745425720

手机：‭13119587361‬(同微信)

商务微信：13119587361 (添加时请备注)

投稿邮箱：1745425720@qq.com

栏目推荐

新壹科技发布新壹视频大模型数字人主持人成为关注焦点_商业要闻_财经

做有温度的金融服务度小满商家服务助手为小店“烟火气”赋能_商业要闻_财经