夜间模式 切换到宽版

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 74|回复: 4

[数码资讯] 阿里通义千问 Qwen3-4B-2507 双料更新

[复制链接]
  • 打卡等级:功行圆满
  • 打卡总天数:853
发表于 2025-8-7 08:49 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
通义千问 Qwen 昨日(8 月 6 日)发布公告,宣布,推出 Qwen3-4B-Instruct-2507 和 Qwen3-4B-Thinking-2507 两个模型,大幅提升性能。

官方表示,SLM(Small Language Models)对 Agentic AI 的发展极具价值,“2507”版本的 Qwen3-4B 模型,体积小,性能强,对手机等端侧硬件部署尤为友好。



IT之家援引博文介绍,在非推理(non-thinking)领域,Qwen3-4B-Instruct-2507 显著提升通用能力,目标成为更全能的端侧利器。

该模型掌握更多语言和长尾知识,上下文理解扩展至 256K,小模型也能处理长文本。该模型通用能力超越了闭源的小尺寸模型 GPT-4.1-nano,性能接近等规模的 Qwen3-30B-A3B(non-thinking)。

官方表示该模型更像一位高效的“执行专家”,遵循指令、迅速响应,更适合用于内容创作、工具调用等。

在推理(thinking)领域,Qwen3-4B-Thinking-2507 大幅提升了推理能力,AIME25 高达 81.3 分。Qwen3-4B-Thinking-2507 的推理表现可媲美中等模型 Qwen3-30B-Thinking,在聚焦数学能力的 AIME25 测评中,以 4B 参数量斩获惊人的 81.3 分的好成绩。



官方表示该模型像一位严谨的“学术专家”,面对复杂问题逐步推理,完成任务更深入可靠。
  • 打卡等级:已臻大成
  • 打卡总天数:524
发表于 2025-8-7 09:27 | 显示全部楼层
看看
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:547
发表于 2025-8-7 09:53 | 显示全部楼层
谢谢楼主分享!
回复 支持 反对

使用道具 举报

  • 打卡等级:功行圆满
  • 打卡总天数:840
发表于 2025-8-7 10:00 | 显示全部楼层
谢谢分享。
回复 支持 反对

使用道具 举报

  • 打卡等级:功行圆满
  • 打卡总天数:856
发表于 2025-8-7 10:20 | 显示全部楼层
感谢分享!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版| 手机版| 小黑屋| RSS| 举报不良信息| 精睿论坛 ( 鄂ICP备07005250号-1 )

GMT+8, 2026-6-30 04:09 , Processed in 0.330601 second(s), 4 queries , Gzip On, Redis On.

Powered by VC52.CN

快速回复 返回顶部 返回列表