找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 62|回复: 1

[科技新闻] 除夕夜迎“源神”!阿里千问3.5发布,原生多模态架构,我直接做了个塔防游戏,绝了!

[复制链接]
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2026-2-16 19:07 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
大家好啊,我是除夕还在卷的甲木。

最近这段时间,国内AI圈属实太卷了....

春节前各家公司都跟打了鸡血似的,

DeepSeek更新了小版本,紧接着智谱GLM5发布、然后Minimax 2.5也跟进,再之后豆包2.0模型发布,国外那边OpenAI、Anthropic也是在前几周更新了..

整个2月就跟AI军备竞赛似的,每天醒来都有新东西要追,我的待测清单比年货清单还长..

1.webp

我就纳闷了,整个晋西北都乱成一锅粥了,阿里干嘛呢。。

春节前这波密集发布,已经不是“卷不卷”的问题了,是你不发,市场就忘了你的问题。

但就在今天除夕当天,阿里直接丢了个重磅炸弹:

千问3.5,正式上线并开源发布。

2.webp

千问官网已经可以体验最新3.5-Plus版本
你没看错,除夕发新模型,这个节奏..阿里的同学属实是加班到位了。

给大家拜早年的同时,我忍不住第一时间测了一下..

来,先看个视频,直接用千问3.5搓了个塔防游戏,小伙伴们玩的都很爽哈哈哈

体验地址在后边!

这个Case里面融合了千问3.5的推理能力、Coding能力、Agent能力、多模态理解等综合方面的各个能力,一会给大家详细地去讲一下这个Case。

先说整体结论(纯个人主观)


  • 千问3.5 架构层面有大提升,而且397B总参激活17B,速度直接拉满
  • 原生多模态能力上线,对于网页复刻、细粒度图像识别做的比较到位
  • 部分场景已经堪比Gemini3.0 Pro了,但是泛化能力上有待提高
  • 文本能力似乎并没有太大提升,一会给大家看个Case
  • 最关键的:全部开源,Apache 2.0 协议,发布即可用
接下来,我们一个个来看。

架构革新、开源、性价比超高


如果你关注过我之前的文章,你会知道我一直推荐千问系列。

不是因为“国产之光”这种标签,而是一个很现实的原因:

做企业本地化部署的时候,开源模型里首选就是千问。

为什么?

全尺寸开源,从 0.5B 到上百B 全覆盖,你能按照自己的算力条件和业务场景自由选型。这个之前就给大家说过,Apache 2.0 协议,商用无门槛。

而且阿里的生态支持:百炼平台、魔搭社区、各种衍生工具,让部署这件事的工程确定性非常高。

这就是「全链路生态」的优势。

所以当千问3.5发布的时候,我关心的不只是"强不强",更关心的是:

这次的架构升级,能不能让开源模型的天花板再往上捅一捅?


先说最核心的变化。

过去两年,大模型行业一直在信奉一件事:大力出奇迹

参数从千亿堆向万亿,性能确实涨了,但代价也涨了。部署要专用集群,推理要烧算力,中小企业用不起,端侧设备更跑不动。

千问3.5换了一种思路:不比谁更大,比谁更聪明。


  • 千问3.5引入了混合注意力机制,让模型根据信息的重要程度动态分配注意力资源,该略读的略读,该精读的精读
  • 千问3.5将稀疏混合专家架构推向了极致:397B 的总参数,每次推理只激活 17B。
  • 上下文也扩展到了1M。同时将词表从150k扩展到250K,支持语言(方言)扩展到201种。
  • 传统自回归模型每次只预测下一个 token,千问3.5在训练阶段就学会了对后续多个位置进行联合预测,推理速度大幅提升!
  • 还做了一些深层优化包括注意力门控机制、归一化策略和专家路由初始化等等,共同确保架构创新在万亿级token训练中真正跑得通、跑得稳。
3.webp

这项技术源自千问团队斩获 NeurIPS 2025 最佳论文 的门控注意力机制(Gated Attention),不是实验室阶段的论文,是已经落地到生产模型里的真技术。

当这些技术同时作用于一个模型,结果是什么?

千问3.5 以 397B 总参数,每次激活仅 17B,实现与 GPT-5.2、Gemini-3-Pro 同级的性能表现。与上一代超万亿参数的 Qwen3-Max 相比,部署成本直降 60%,推理速度大幅提升。

4.webp

Ag模型效果随着RL Environment scaling带来的增益
说白了,以前你得花10块钱干的事,现在4块钱就搞定了,而且干得一样好。

对企业来说,这是真金白银的成本优化


说完能力,来说价格。

5.webp

先来看看传统榜单..
这次模型在各种榜单上的指标,比Qwen3-Max-Thinking更强,但参数更少,更快,Tokens成本也打下去了,API价格每百万Token低至0.8元,仅为Gemini 3 pro的1/18。

最强性能 × 最低成本,第一次同时出现在同一个模型上。

而且千问3.5 还将语言支持扩展到了 201种,词表从150K扩展到250K,小语种编码效率最高提升60%。这对做全球化业务的团队来说,吸引力很大(出海赚美刀啊

后续还会开源不同尺寸、不同功能的模型,覆盖本地、端侧等各种部署场景。开发者、科研人员、中小企业都可以免费下载商用。

实测:用千问3.5一口气做了个塔防游戏


好了,数据和特性说了一堆,但我们懂的都懂,关注的一直都是它到底能不能干活?

这次我做了一个比较有趣的测试,把千问3.5接入 ClaudeCode,直接让它帮我开发一款塔防类游戏。

6.png

为什么选塔防?

当然因为有趣啊。。

哦不是,因为这类游戏的开发涉及多系统协同:地图网格系统、路径寻找、防御塔放置与升级、敌人波次生成、弹道计算、碰撞检测、经济系统、UI交互..

我的测试方式是这样的:

首先,我写了一个大概的需求Prompt,这个prompt也是千问3.5帮我写的,包含了地图设计、三种防御塔(箭塔、炮塔、冰塔)的完整参数、三种敌人(基础、快速、坦克)的属性、10波敌人的递进机制、经济系统和生命系统等等。

请帮我实现一个经典塔防策略小游戏。技术约束:纯 HTML + CSS + JavaScript,不依赖任何外部框架或库,单文件实现。
页面背景 #1A1A2E。游戏画布使用 Canvas,尺寸 800×560px 居中,背景为草地绿 #4A7C59。地图使用 20×14 的网格系统,每格40×40px。路径由预设的网格坐标序列定义(从左侧入口蜿蜒到右侧出口),路径格颜色为泥土色 #C4A35A,宽度占满整格,路径边缘加 1px 深色描边。非路径格为草地,可放置防御塔。
三种防御塔——箭塔:造价 50 金,攻击力 10,射程 120px,攻速 1 次/秒,弹道为从塔顶射出的棕色小三角(4×8px)直线飞向目标,速度 8px/帧,颜色 #8B4513,塔身为灰色 #778899方块上一个三角形塔顶;炮塔:造价 100 金,攻击力 30,射程 100px,攻速 0.5 次/秒,弹道为黑色圆球 5px 半径抛物线飞行,命中时产生橙红色爆炸圆(半径从 5 扩大到 20px,200ms淡出),范围伤害半径 30px,塔身为深灰 #444 粗方柱;冰塔:造价 75 金,攻击力 5,射程 110px,攻速 0.8 次/秒,命中后减速目标 50%(持续 2 秒),弹道为浅蓝 #87CEEB 菱形,塔身冰蓝色#ADD8E6。每种塔可升级两次,每次升级花费为建造费的 60%,攻击力 +40%、射程 +15%。
敌人系统:共 10 波,每波间隔 15 秒(有倒计时显示)。敌人沿路径匀速行走。基础敌人:红色圆 12px 半径,血量 50,速度 1.5px/帧;快速敌人:黄色小圆 8px,血量 30,速度3px/帧;坦克敌人:紫色大圆 16px,血量 200,速度 0.8px/帧。每波敌人数量从 5 递增到 20,后期混合出现。敌人头顶显示红色血条(宽 24px,高 3px)。
经济与生命系统:初始金币 200,击杀敌人奖励 10-25 金。初始生命 20,敌人到达终点扣 1 点生命,归零则游戏结束弹出半透明黑色遮罩和"Game Over"文字(红色 60px)及"重新开始"按钮。画布上方HUD 显示:波次、金币、生命值,字号 18px 白色。右侧塔选择面板用三个带图标按钮表示。
然后把生成的代码直接丢到 ClaudeCode 里跑。

结果让我挺意外的。

第一把跑整个游戏的完成度非常高:


  • ✅ 蜿蜒的路径渲染正确,敌人沿路径移动流畅
  • ✅ 三种防御塔的攻击方式、弹道轨迹都按要求实现
  • ✅ 炮塔的范围爆炸、冰塔的减速效果都在
  • ✅ 敌人波次递进,后期混合出现不同类型
  • ✅ 经济系统正常运转,升级机制可用
7.png

这是第一版的界面,整体的运行机制和逻辑是没问题的,

但是一个游戏,当然要讲究画面的精美度了,然后我又用千问3.5帮我根据游戏界面的元素,生成了一批prompt,找了惯用的AI绘画Agent跑了一遍游戏素材图。

8.webp

之后打包下载到项目所在目录,直接放到resources文件夹下。

之后我让它查找该目录 resource 文件夹下的所有游戏截图,文件名即为对应的含义。请你按照我们刚才设计的游戏,把页面上所有的动态效果和游戏素材,全部替换成本文件里的图片。

它就开始逐一检查文件夹里面的图片,跟游戏中的对应关系,然后做出修改。

生成了第二版,

9.webp

在这中间我还跟它对话了很多次,包括我觉得画面分配有问题,直接截图告诉千问3.5,让它进行调整。

10.webp

漏了很多对话没有截图....被CC压缩了
在这里我还跟它对话了好几次,每次都是在游戏界面里面把截图发给 千问3.5,然后他就基于截图内容进行修改,并调用各种工具去执行。

11.webp

它的 Agent 能力和多模态理解能力,在这方面起到了很大的作用。

经过了几轮对话之后,最终得到了完整的游戏画面!

12.webp

从第1波的轻松防守,到后面几波被"坦克敌人"压着打,游戏体验的节奏感居然还不错..

13.webp

之后,我把它降低了难度...

我还专门为此录了一个完整的游戏通关过程视频。

其实还有一些视觉细节可以打磨得更精致。

但作为几个Prompt出来的游戏,这个完成度我给高分。

这个其实就是模型推理能力、Agent 能力和多模态能力综合测试下来的一个结果,效果还是很不错的。

试玩链接🔗在这里了http://47.90.249.184/game/tower-defense-v3.html,欢迎PC端体验!


除了这个场景之外,我还测了「迷宫生成与寻路算法可视化」

请帮我实现一个迷宫生成与寻路算法可视化的交互页面。技术约束:纯 HTML + CSS + JavaScript,不依赖任何外部框架或库,单文件实现。
- 页面整体背景色 #1A1A2E,分为左侧控制面板(宽 260px,背景 #16213E,内边距 20px)和右侧迷宫画布区域。迷宫使用 Canvas 绘制,画布居中显示,默认迷宫规格 25×25 格,每格大小 22px,墙壁宽度2px。墙壁颜色 #0F3460,通道颜色 #1A1A2E,起点(左上角)标记为绿色 #00FF7F 方块,终点(右下角)标记为红色 #FF4757 方块。
- 迷宫生成算法采用 DFS 递归回溯法。
- 求解算法提供三种选择,用单选按钮组切换:A* 算法、BFS 广度优先、DFS 深度优先。可视化配色方案——已探索并关闭的节点:#533483(紫色),当前开放列表/队列中的节点:#E94560(粉红),当前正在探索的节点:#FFDD57(亮黄色,尺寸稍大闪烁),最终最短路径:#00FF7F(翠绿色)加粗显示。求解速度同样可调,滑块范围 1-50步/帧。每种算法执行完毕后,在画布下方显示统计信息:探索节点数、路径长度、耗时(毫秒),字体 Consolas 14px 白色。
- 控制面板包含:迷宫大小下拉选择(15×15 / 25×25 / 35×35 / 51×51)、生成速度滑块、求解速度滑块、"生成迷宫"按钮(背景 #E94560,白色字,圆角 8px)、"开始求解"按钮、"重置"按钮。底部放置算法说明区域,用折叠面板呈现三种算法的简要描述,字号 12px,颜色 #A0A0C0。整个动画逐帧绘制使用 requestAnimationFrame 配合步进计数器控制速度。
效果也很不错。

14.png

还有多模态理解的图片,拿聪哥之前用的图片做了个测试:

15.webp

结果回答正确

16.webp

以及,我用千问3.5直接用我的「杂志排版Skill」生成的杂志风格图片。

17.webp

理解、执行、推理,测下来都非常丝滑,推理速度变得非常快..


结语


测下来,源神千问3.5的确有点东西。

在除夕这天发布,其实也挺应景的,

你看这一年,DeepSeek、千问、智谱、文心、混元、Kimi、Minimax、豆包..

国内AI行业,真的是百花齐放,共贺新春

这不是某一家独大的故事,是整个行业在狂奔。

千问,也给乙巳年最后,画上了一个圆满的句号!

新春快乐,源力觉醒。

期待千问在新的一年继续往前冲。

也期待我们国内的AI,

越来越强。

再次祝大家新年快乐!!!!!

以上。
  • 打卡等级:已臻大成
  • 打卡总天数:449
发表于 2026-2-16 22:14 | 显示全部楼层
这价格可以啊
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )|网站地图

GMT+8, 2026-2-17 02:36 , Processed in 0.131453 second(s), 5 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表