夜间模式 切换到宽版

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 86|回复: 2

[数码资讯] 阿里通义千问推出全新推理模型 Qwen3-30B-A3B-Thinking-2507,多项能力显著提升

[复制链接]
  • 打卡等级:功行圆满
  • 打卡总天数:854
发表于 2025-7-31 08:51 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
阿里通义千问今日宣布推出全新推理模型 Qwen3-30B-A3B-Thinking-2507。相较于 4 月 29 日开源的 Qwen3-30-A3B 模型,新模型在推理能力、通用能力及上下文长度上有了显著提升:



新模型在聚焦数学能力的 AIME25 评测中斩获 85.0 的高分,在代码能力测试 LiveCodeBench v6 中得分 66.0,两项核心推理能力均超越 Gemini2.5-Flash(thinking)、Qwen3-235B-A22B(thinking);新模型的知识水平(GPQA、MMLU-Pro)也较上一版本进步显著。

在写作(WritingBench)、Agent 能力(BFCL-v3)、多轮对话和多语言指令遵循(MultiIF)等通用能力评测中,Qwen3-30B-A3B-Thinking-2507 均超越 Gemini2.5-Flash(thinking)、Qwen3-235B-A22B(thinking)。

更长的上下文理解,原生支持 256K tokens,可扩展至 1M tokens。





此外,新模型的思考长度(thinking length)也增加了,官方推荐在高度复杂的推理任务中设置更长的思考预算,以充分发挥它的潜力。

官方透露,目前 Qwen3-30B-A3B-Thinking-2507 已在魔搭社区、HuggingFace 上开源,其轻量体积可轻松实现消费级硬件的本地部署;同时,其也在 Qwen Chat 上同步上线了新模型。
  • 打卡等级:已臻大成
  • 打卡总天数:525
发表于 2025-7-31 10:14 | 显示全部楼层
看看
回复 支持 反对

使用道具 举报

  • 打卡等级:功行圆满
  • 打卡总天数:841
发表于 2025-7-31 11:05 | 显示全部楼层
谢谢分享。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版| 手机版| 小黑屋| RSS| 举报不良信息| 精睿论坛 ( 鄂ICP备07005250号-1 )

GMT+8, 2026-6-30 12:10 , Processed in 0.185510 second(s), 4 queries , Gzip On, Redis On.

Powered by VC52.CN

快速回复 返回顶部 返回列表