中国电信研究院发布天罡大模型评测榜单，豆包大模型排名国产第一

近日，中国电信研究院携手上海人工智能实验室、清华大学等产学研机构，发布了天罡通用大模型评测榜单。该榜单重点围绕大模型的能力和安全指标进行评估，GPT-4o综合成绩排名第一；豆包pro、通义千问Qwen-Max和智谱GLM-4在国产大模型中名列前三。

图：“天罡”通用大模型评测榜单

本次测评通过全面评测维度、权威评测题库、动态抽题、多裁判模型判别和人工审核等机制对国内外主流通用大模型开展了评测，评测对象包括国际头部闭源OpenAI的GPT-4系列、Google的Gemini系列、Anthropic的Claude系列、国内主流的闭源模型以及国内外主流的开源模型，评测结果展示了当前开源/闭源通用大模型整体能力分布和差距。

评测结果显示，GPT-4o在语言理解、认知推理、智能体等方面能力表现出色，总得分82.55分。国内头部大模型豆包、智谱清言在中文场景已达到GPT-4o的90%分位水平。其中，豆包pro模型得分达到79.38分，不仅在国产模型中排名最高，同时也超过了Gemini 1.5 pro、Claude3-Opus、Mistral Large等海外模型。

豆包大模型由字节跳动自研，是国内首批通过算法备案的大模型之一，正在通过字节跳动旗下云服务平台火山引擎面向企业提供服务。在近日召开的火山引擎AI创新巡展上海站活动中，新版豆包语言模型正式亮相，宣布其综合能力相比今年5月首次发布时提升了20.3%。（作者：周亮）

2024上半年全球电视排名出炉：国产海信第一小米第五

鼎胜新材取得低成本高光亮的奶粉封盖用铝箔制备方法专利，使成本降到最低的同时保证铝卷表面的质量合格

中国电信研究院发布天罡大模型评测榜单，豆包大模型排名国产第一

相关阅读

婴幼儿奶粉哪一个品牌好？给你介绍一款好的宝宝奶粉

婴幼儿奶粉都有什么品牌？这一个品牌适合中国宝宝

宝宝奶粉哪个品牌好？有机高营养的它助宝宝轻松追高

抓住宝宝的成长关键期，婴儿奶粉全国十大品牌排名中要为宝宝选哪款奶粉？

防腹泻奶粉有哪些品牌？不妨给宝宝喝羊奶粉

君乐宝小小鲁班诠能搭档儿童奶粉，宝宝成长的好伙伴！

上韵奶粉亲和吸收，宝宝成长的秘密武器

伊利金领冠珍护2段奶粉测评，你会为宝宝选择国产奶粉吗？

目录[+]