除夕夜迎“源神”！阿里千问3.5发布，原生多模态架构，我直接做了个塔防游戏，绝了！

mulunbo · 发表于 2026-2-16 19:07

马上注册，查看更多内容，享用更多功能，让你轻松玩转社区。

您需要登录才可以下载或查看，没有账号？注册

×

大家好啊，我是除夕还在卷的甲木。

最近这段时间，国内AI圈属实太卷了....

春节前各家公司都跟打了鸡血似的，

DeepSeek更新了小版本，紧接着智谱GLM5发布、然后Minimax 2.5也跟进，再之后豆包2.0模型发布，国外那边OpenAI、Anthropic也是在前几周更新了..

整个2月就跟AI军备竞赛似的，每天醒来都有新东西要追，我的待测清单比年货清单还长..

我就纳闷了，整个晋西北都乱成一锅粥了，阿里干嘛呢。。

春节前这波密集发布，已经不是“卷不卷”的问题了，是你不发，市场就忘了你的问题。

但就在今天除夕当天，阿里直接丢了个重磅炸弹：

千问3.5，正式上线并开源发布。

千问官网已经可以体验最新3.5-Plus版本

你没看错，除夕发新模型，这个节奏..阿里的同学属实是加班到位了。

给大家拜早年的同时，我忍不住第一时间测了一下..

来，先看个视频，直接用千问3.5搓了个塔防游戏，小伙伴们玩的都很爽哈哈哈

体验地址在后边！

这个Case里面融合了千问3.5的推理能力、Coding能力、Agent能力、多模态理解等综合方面的各个能力，一会给大家详细地去讲一下这个Case。

先说整体结论（纯个人主观）：

千问3.5 架构层面有大提升，而且397B总参激活17B，速度直接拉满
原生多模态能力上线，对于网页复刻、细粒度图像识别做的比较到位
部分场景已经堪比Gemini3.0 Pro了，但是泛化能力上有待提高
文本能力似乎并没有太大提升，一会给大家看个Case
最关键的：全部开源，Apache 2.0 协议，发布即可用

接下来，我们一个个来看。

架构革新、开源、性价比超高

如果你关注过我之前的文章，你会知道我一直推荐千问系列。

不是因为“国产之光”这种标签，而是一个很现实的原因：

做企业本地化部署的时候，开源模型里首选就是千问。

为什么？

全尺寸开源，从 0.5B 到上百B 全覆盖，你能按照自己的算力条件和业务场景自由选型。这个之前就给大家说过，Apache 2.0 协议，商用无门槛。

而且阿里的生态支持：百炼平台、魔搭社区、各种衍生工具，让部署这件事的工程确定性非常高。

这就是「全链路生态」的优势。

所以当千问3.5发布的时候，我关心的不只是"强不强"，更关心的是：

这次的架构升级，能不能让开源模型的天花板再往上捅一捅？

先说最核心的变化。

过去两年，大模型行业一直在信奉一件事：大力出奇迹。

参数从千亿堆向万亿，性能确实涨了，但代价也涨了。部署要专用集群，推理要烧算力，中小企业用不起，端侧设备更跑不动。

千问3.5换了一种思路：不比谁更大，比谁更聪明。

千问3.5引入了混合注意力机制，让模型根据信息的重要程度动态分配注意力资源，该略读的略读，该精读的精读。
千问3.5将稀疏混合专家架构推向了极致：397B 的总参数，每次推理只激活 17B。
上下文也扩展到了1M。同时将词表从150k扩展到250K，支持语言（方言）扩展到201种。
传统自回归模型每次只预测下一个 token，千问3.5在训练阶段就学会了对后续多个位置进行联合预测，推理速度大幅提升！
还做了一些深层优化包括注意力门控机制、归一化策略和专家路由初始化等等，共同确保架构创新在万亿级token训练中真正跑得通、跑得稳。

这项技术源自千问团队斩获 NeurIPS 2025 最佳论文 的门控注意力机制（Gated Attention），不是实验室阶段的论文，是已经落地到生产模型里的真技术。

当这些技术同时作用于一个模型，结果是什么？

“
千问3.5 以 397B 总参数，每次激活仅 17B，实现与 GPT-5.2、Gemini-3-Pro 同级的性能表现。与上一代超万亿参数的 Qwen3-Max 相比，部署成本直降 60%，推理速度大幅提升。

Ag模型效果随着RL Environment scaling带来的增益

说白了，以前你得花10块钱干的事，现在4块钱就搞定了，而且干得一样好。

对企业来说，这是真金白银的成本优化。

说完能力，来说价格。

先来看看传统榜单..

这次模型在各种榜单上的指标，比Qwen3-Max-Thinking更强，但参数更少，更快，Tokens成本也打下去了，API价格每百万Token低至0.8元，仅为Gemini 3 pro的1/18。

最强性能 × 最低成本，第一次同时出现在同一个模型上。

而且千问3.5 还将语言支持扩展到了 201种，词表从150K扩展到250K，小语种编码效率最高提升60%。这对做全球化业务的团队来说，吸引力很大（出海赚美刀啊

后续还会开源不同尺寸、不同功能的模型，覆盖本地、端侧等各种部署场景。开发者、科研人员、中小企业都可以免费下载商用。

实测：用千问3.5一口气做了个塔防游戏

好了，数据和特性说了一堆，但我们懂的都懂，关注的一直都是它到底能不能干活？

这次我做了一个比较有趣的测试，把千问3.5接入 ClaudeCode，直接让它帮我开发一款塔防类游戏。

为什么选塔防？

当然因为有趣啊。。

哦不是，因为这类游戏的开发涉及多系统协同：地图网格系统、路径寻找、防御塔放置与升级、敌人波次生成、弹道计算、碰撞检测、经济系统、UI交互..

我的测试方式是这样的：

首先，我写了一个大概的需求Prompt，这个prompt也是千问3.5帮我写的，包含了地图设计、三种防御塔（箭塔、炮塔、冰塔）的完整参数、三种敌人（基础、快速、坦克）的属性、10波敌人的递进机制、经济系统和生命系统等等。

请帮我实现一个经典塔防策略小游戏。技术约束：纯 HTML + CSS + JavaScript，不依赖任何外部框架或库，单文件实现。
- 页面背景 #1A1A2E。游戏画布使用 Canvas，尺寸 800×560px 居中，背景为草地绿 #4A7C59。地图使用 20×14 的网格系统，每格40×40px。路径由预设的网格坐标序列定义（从左侧入口蜿蜒到右侧出口），路径格颜色为泥土色 #C4A35A，宽度占满整格，路径边缘加 1px 深色描边。非路径格为草地，可放置防御塔。
- 三种防御塔——箭塔：造价 50 金，攻击力 10，射程 120px，攻速 1 次/秒，弹道为从塔顶射出的棕色小三角（4×8px）直线飞向目标，速度 8px/帧，颜色 #8B4513，塔身为灰色 #778899方块上一个三角形塔顶；炮塔：造价 100 金，攻击力 30，射程 100px，攻速 0.5 次/秒，弹道为黑色圆球 5px 半径抛物线飞行，命中时产生橙红色爆炸圆（半径从 5 扩大到 20px，200ms淡出），范围伤害半径 30px，塔身为深灰 #444 粗方柱；冰塔：造价 75 金，攻击力 5，射程 110px，攻速 0.8 次/秒，命中后减速目标 50%（持续 2 秒），弹道为浅蓝 #87CEEB 菱形，塔身冰蓝色#ADD8E6。每种塔可升级两次，每次升级花费为建造费的 60%，攻击力 +40%、射程 +15%。
- 敌人系统：共 10 波，每波间隔 15 秒（有倒计时显示）。敌人沿路径匀速行走。基础敌人：红色圆 12px 半径，血量 50，速度 1.5px/帧；快速敌人：黄色小圆 8px，血量 30，速度3px/帧；坦克敌人：紫色大圆 16px，血量 200，速度 0.8px/帧。每波敌人数量从 5 递增到 20，后期混合出现。敌人头顶显示红色血条（宽 24px，高 3px）。
- 经济与生命系统：初始金币 200，击杀敌人奖励 10-25 金。初始生命 20，敌人到达终点扣 1 点生命，归零则游戏结束弹出半透明黑色遮罩和"Game Over"文字（红色 60px）及"重新开始"按钮。画布上方HUD 显示：波次、金币、生命值，字号 18px 白色。右侧塔选择面板用三个带图标按钮表示。

然后把生成的代码直接丢到 ClaudeCode 里跑。

结果让我挺意外的。

第一把跑整个游戏的完成度非常高：

✅ 蜿蜒的路径渲染正确，敌人沿路径移动流畅
✅ 三种防御塔的攻击方式、弹道轨迹都按要求实现
✅ 炮塔的范围爆炸、冰塔的减速效果都在
✅ 敌人波次递进，后期混合出现不同类型
✅ 经济系统正常运转，升级机制可用

这是第一版的界面，整体的运行机制和逻辑是没问题的，

但是一个游戏，当然要讲究画面的精美度了，然后我又用千问3.5帮我根据游戏界面的元素，生成了一批prompt，找了惯用的AI绘画Agent跑了一遍游戏素材图。

之后打包下载到项目所在目录，直接放到resources文件夹下。

之后我让它查找该目录 resource 文件夹下的所有游戏截图，文件名即为对应的含义。请你按照我们刚才设计的游戏，把页面上所有的动态效果和游戏素材，全部替换成本文件里的图片。

它就开始逐一检查文件夹里面的图片，跟游戏中的对应关系，然后做出修改。

生成了第二版，

在这中间我还跟它对话了很多次，包括我觉得画面分配有问题，直接截图告诉千问3.5，让它进行调整。

漏了很多对话没有截图....被CC压缩了

在这里我还跟它对话了好几次，每次都是在游戏界面里面把截图发给千问3.5，然后他就基于截图内容进行修改，并调用各种工具去执行。

它的 Agent 能力和多模态理解能力，在这方面起到了很大的作用。

经过了几轮对话之后，最终得到了完整的游戏画面！

从第1波的轻松防守，到后面几波被"坦克敌人"压着打，游戏体验的节奏感居然还不错..

之后，我把它降低了难度...

我还专门为此录了一个完整的游戏通关过程视频。

其实还有一些视觉细节可以打磨得更精致。

但作为几个Prompt出来的游戏，这个完成度我给高分。

这个其实就是模型推理能力、Agent 能力和多模态能力综合测试下来的一个结果，效果还是很不错的。

试玩链接🔗在这里了http://47.90.249.184/game/tower-defense-v3.html，欢迎PC端体验！

除了这个场景之外，我还测了「迷宫生成与寻路算法可视化」

请帮我实现一个迷宫生成与寻路算法可视化的交互页面。技术约束：纯 HTML + CSS + JavaScript，不依赖任何外部框架或库，单文件实现。
- 页面整体背景色 #1A1A2E，分为左侧控制面板（宽 260px，背景 #16213E，内边距 20px）和右侧迷宫画布区域。迷宫使用 Canvas 绘制，画布居中显示，默认迷宫规格 25×25 格，每格大小 22px，墙壁宽度2px。墙壁颜色 #0F3460，通道颜色 #1A1A2E，起点（左上角）标记为绿色 #00FF7F 方块，终点（右下角）标记为红色 #FF4757 方块。
- 迷宫生成算法采用 DFS 递归回溯法。
- 求解算法提供三种选择，用单选按钮组切换：A* 算法、BFS 广度优先、DFS 深度优先。可视化配色方案——已探索并关闭的节点：#533483（紫色），当前开放列表/队列中的节点：#E94560（粉红），当前正在探索的节点：#FFDD57（亮黄色，尺寸稍大闪烁），最终最短路径：#00FF7F（翠绿色）加粗显示。求解速度同样可调，滑块范围 1-50步/帧。每种算法执行完毕后，在画布下方显示统计信息：探索节点数、路径长度、耗时（毫秒），字体 Consolas 14px 白色。
- 控制面板包含：迷宫大小下拉选择（15×15 / 25×25 / 35×35 / 51×51）、生成速度滑块、求解速度滑块、"生成迷宫"按钮（背景 #E94560，白色字，圆角 8px）、"开始求解"按钮、"重置"按钮。底部放置算法说明区域，用折叠面板呈现三种算法的简要描述，字号 12px，颜色 #A0A0C0。整个动画逐帧绘制使用 requestAnimationFrame 配合步进计数器控制速度。

效果也很不错。

还有多模态理解的图片，拿聪哥之前用的图片做了个测试：

结果回答正确

以及，我用千问3.5直接用我的「杂志排版Skill」生成的杂志风格图片。

理解、执行、推理，测下来都非常丝滑，推理速度变得非常快..

结语

测下来，源神千问3.5的确有点东西。

在除夕这天发布，其实也挺应景的，

你看这一年，DeepSeek、千问、智谱、文心、混元、Kimi、Minimax、豆包..

国内AI行业，真的是百花齐放，共贺新春。

这不是某一家独大的故事，是整个行业在狂奔。

千问，也给乙巳年最后，画上了一个圆满的句号！

新春快乐，源力觉醒。

期待千问在新的一年继续往前冲。

也期待我们国内的AI，

越来越强。

再次祝大家新年快乐！！！！！

以上。

Formular · 发表于 2026-2-16 22:14

这价格可以啊

账号		自动登录	找回密码
密码			注册

[科技新闻] 除夕夜迎“源神”！阿里千问3.5发布，原生多模态架构，我直接做了个塔防游戏，绝了！

马上注册，查看更多内容，享用更多功能，让你轻松玩转社区。