找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 55|回复: 8

[数码资讯] 中国第一:阿里通义千问 3.5-Max-Preview 首发亮相 LM Arena 国际大模型竞技场

[复制链接]
  • 打卡等级:功行圆满
  • 打卡总天数:752
发表于 2026-3-20 08:55 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
阿里千问大模型家族再迎新成员。今日,Qwen3.5-Max-Preview 作为千问 3.5 系列的旗舰模型预览版,在全球大模型竞技平台 LM Arena 正式亮相,并获得 1464 分的综合得分。

凭借这一成绩,阿里千问在 LM Arena 全球大模型公司排行榜中的排名上升至全球第五位,位列中国公司首位。



据阿里云介绍,LM Arena 是由国际开源研究机构 LMSYS 组织的第三方大模型评测平台,其评测机制采用模型两两匿名对战,由全球开发者进行盲测投票,最终根据胜负结果形成模型分数与排名。由于采用开放式对战与人工评估相结合的方式,该榜单被业界视为当前最具参考价值的大模型性能评测之一。

在本次评测中,Qwen3.5-Max-Preview 在没有风格控制(without style control)的绝对胜率比拼中,整体性能排名全球第六。在细分任务层面,该模型的数学能力排名全球第五,专家级文本处理能力排名全球第十。此次亮相也是千问 3.5 系列首次以旗舰级模型身份参与国际第三方评测。



IT之家注意到,自除夕以来,阿里千问今年已陆续开源 Qwen3.5 系列的多款模型,覆盖从 0.8B 到 397B 共 8 种不同参数规模,各尺寸模型均在同参数量级上取得领先性能。

其中,Qwen3.5-Plus 采用总参数 3970 亿、激活参数 170 亿的架构设计,以较小的激活参数实现了优于部分参数量更大模型的性能表现。此次亮相的 Qwen3.5-Max-Preview 是该系列旗舰模型的预览版本,后续将根据社区反馈持续优化迭代。
  • 打卡等级:已臻大成
  • 打卡总天数:452
发表于 2026-3-20 09:50 | 显示全部楼层
谢谢楼主分享!
回复 支持 反对

使用道具 举报

  • 打卡等级:功行圆满
  • 打卡总天数:754
发表于 2026-3-20 10:49 | 显示全部楼层
感谢分享!
回复 支持 反对

使用道具 举报

  • 打卡等级:自成一派
  • 打卡总天数:184
发表于 2026-3-20 11:06 | 显示全部楼层
谢谢分享!
回复 支持 反对

使用道具 举报

  • 打卡等级:自成一派
  • 打卡总天数:184
发表于 2026-3-20 13:12 | 显示全部楼层
谢谢分享~
回复 支持 反对

使用道具 举报

  • 打卡等级:自成一派
  • 打卡总天数:131
发表于 2026-3-20 13:19 来自手机 | 显示全部楼层
加油
回复 支持 反对

使用道具 举报

  • 打卡等级:自成一派
  • 打卡总天数:94
发表于 2026-3-20 13:29 | 显示全部楼层
#在这里快速回复#版区有您更精彩
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:719
发表于 2026-3-20 19:28 | 显示全部楼层
支持分享
回复 支持 反对

使用道具 举报

  • 打卡等级:炉火纯青
  • 打卡总天数:61
发表于 2026-3-20 21:21 | 显示全部楼层
版区有您更精彩
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )|网站地图

GMT+8, 2026-3-20 22:49 , Processed in 0.317566 second(s), 4 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表