清华发布大模型性能报告:GPT-4 第一 更懂中文的还是百度
2023-08-10 16:53:35 来源:驱动之家
(资料图片)
快科技 8 月 10 日消息,AI 大模型成为今年的热点,OpenAI 的 ChatGPT 一马当先,微软、谷歌、Meta 紧随其后,国内科技巨头也迅速跟进,现在国内据说已经有上百款大模型问世了。
这么多大模型中,实力到底如何?日前清华大学新闻与传播学院发布了《大语言模型综合性能评估报告》,将国内外的大模型做了一番对比。
该报告还探讨了这些模型在不同知识领域,如创意写作、代码编程、舆情分析、历史知识等方面的回答情况,以及其在解决实际问题中的有效性和局限性。从生成质量、使用与性能、安全与合规三个维度,对目前市场上的 7 个大型语言模型进行了全面的综合评估。
在这 7 款大模型中,GPT-4 获得了毫无悬念的第一,第二名是百度的文心一言,其次是 GPT-3.5,后面就是 Claude、讯飞星火、阿里云的通义千问及昆仑的天工。虽然 GPT-4 各方面领先,但是对国内用户来说,更懂中文的大模型才是关键,这方面百度的文心一言更好,在部分中文语义理解方面,文心一言以 92% 的得分率排名榜首,超越讯飞星火、GPT-4。
这跟百度的大模型包含大量中文文本有关系,因此能够更好地处理本土文化相关的内容。
关键词:
相关阅读
-
清华发布大模型性能报告:GPT-4 第一 ...
快科技8月10日消息,AI大模型成为今年的热点,OpenAI的ChatGPT一马当先 -
汽车加油卡的办理流程是什么(汽车加油...
1、携带单位用户卡开户需提供单位介绍信、主卡人身份证件原件及复印件 -
科普|男性前列腺癌术后尿失禁,如何自...
如果出现尿液漏出,可以在收缩盆底肌的同时再次咳嗽,并观察收缩盆底肌 -
北京姑娘做内衣,靠两款内裤卖了上千万元
让产品变成桥梁。文 易琬玉编辑 郑亚文创业之后,潇洒的社交账号里加了 -
武磊真厉害!狂轰4球笑傲中超,山东泰山...
万众瞩目的中超比赛正在如火如的进行,现如今进行的是第21轮的比赛,强 -
药明康德:2022年至今实控人及一致行动...
8月9日,药明康德披露股东减持计划公告。公告显示,持股5 36%的机构股 -
广东中山一医院院长被抓后,该院人均就...
近日,广东省纪委监委网站“南粤清风网”发布了一篇题为《清风正气... -
医药反腐企业合规成焦点 君实生物回应
据21财经,随着医药反腐工作持续推进,虚假学术会议、带金销售等容易涉 -
“四严”举措为群众挽回损失500万元
市地方金融监管局推进防范和处置非法集资“四严”举措为群众挽回损... -
贵州好吃的食物有哪些?
贵州好吃的食物分别有:大方手撕豆干和荞灰豆干,威宁荞酥,赫章赫之林 -
3399元的RTX 4060 Ti Mini显卡来了:ITX板 188mm
NVIDIA的RTX4060Ti显卡已经上市,除了8GB显存版,近期16GB版也上市了, -
儿童保险买什么合适?
选择适合的儿童保险需要考虑孩子的身体状况和家庭财务情况,选择专业的 -
吉利与百度合资成立汽车科技公司
天眼查App显示,8月9日,杭州极与越汽车科技有限公司成立,法定代表人 -
历时四年,腾讯诉多闪用户数据归属案将...
中新财经获悉,8月16日,腾讯诉抖音、多闪不正当竞争案将于天津市 -
云鲸2023年扫地机新品将于8月发布,官方...
以往云鲸基本一年发布一款旗舰机型,且首发价格均在4000元以上,此次云鲸 -
印度老师涉嫌殴打学生后遭家长群殴:头...
遭到殴打的印度老师莫汉·巴布(视频画面截图)海外网8月10日电据《... -
陈芋汐全红婵“小姐俩”继续逐梦 全力...
中国跳水队刚刚从德国柏林跳水世界杯超级总决赛满载而归。跳台“小... -
全民健身进行时,南上海首家冰壶运动馆...
8月8日是全国第15个“全民健身日”。当天,奉贤区除了开展19项各类... -
今年不兴裙子+高跟鞋了!满大街都在穿“...
每年一到夏末初秋的季节,相信很多人讨论最多的话题就是穿衣打扮,尤其 -
咳嗽有痰吃什么好呢
咳嗽在我们的生活中是比较多见的一种疾病,虽然常见但是并不好治,带来