夜间模式 切换到宽版

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 24|回复: 3

[科技新闻] 斯坦福权威报告:阿里AI贡献度全球第三、中国第一

[复制链接]
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2026-4-16 20:29 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
4月16日消息,斯坦福大学人工智能研究所发布了最新一期《2026年人工智能指数报告》,阿里巴巴位列2025年全球顶级模型贡献榜第三名,同时也是入选重要模型最多的中国科技公司。该报告指出,当前中美顶级大模型差距“实质性消除”,头部模型间表现相当,呈并跑态势。报告显示,在前20的AI机构中,中国11家超过美国位居首位。
1.webp


据了解,《人工智能指数报告》由斯坦福大学人工智能研究所于2017年推出,每年联合全球学术、产业与政策领域专家对当前人工智能行业的技术进步、经济影响和社会影响提供严谨客观的分析,是业界公认的AI领域最权威的年度报告之一。
报告指出,目前中美仍是全球AI最具影响力的两大国家,双方差距已“实质性消除”(effectively closed),呈现并跑态势。2025年,美国发布了50个重要模型,中国发布了30个。其中仅阿里巴巴就贡献了11个,在国产模型中占比接近40%,仅次于Open AI 的19个和Google的12个,连续第二年位居全球第三。在Arena排行榜上,美国的Anthropic、xAI、Google、OpenAI和中国的阿里巴巴、DeepSeek等六家企业共同构成顶级梯队,彼此间竞争焦灼,且竞争焦点逐渐从性能比拼转向成本、可靠性与真实世界实用性。
斯坦福报告还显示,在多项细分能力评测中,阿里千问系列均有亮眼表现。比如,在聚焦真实工作流中工具调用与智能体交互能力的τ-bench基准测试中,Qwen3.5以68.4%的任务成功率,位列全球第三;在体现小语种能力的HELM阿拉伯语测试中,Qwen3以0.79的平均得分(Mean Score)位居中国模型首位,也是最懂阿拉伯语的大模型之一;在考察多学科知识理解与推理能力的MMLU-Pro中,Qwen3.5以87.8%的准确率,媲美Gemini 3.1 Pro、Claude Opus 4.6等国外顶尖模型。
此外,报告中还特别指出,自2023年以来,全球开源AI生态呈爆发式增长。数据显示,GitHub平台上的开源AI项目已突破560万个,Hugging Face社区的模型上传量在两年内增长到3倍。以阿里巴巴、DeepSeek为代表的中国企业在其中表现突出,截至目前,阿里千问大模型共开源400多款,全球衍生模型数量超20万,全球下载量破10亿,是全球第一的开源模型家族。据了解,千问3.6系列也即将推出新的开源模型。
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2026-4-16 21:22 | 显示全部楼层
中美AI并跑后谁会领先?
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2026-4-16 21:22 | 显示全部楼层
阿里千问3.5工具调用成功率68.4%看着挺猛但实际办公里表格错乱识别翻车太影响体验了
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2026-4-16 23:16 | 显示全部楼层
中国,加油!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )|网站地图

GMT+8, 2026-4-17 05:55 , Processed in 0.181983 second(s), 5 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表