马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有账号?注册
×
大家好啊,我是除夕还在卷的甲木。
最近这段时间,国内AI圈属实太卷了....
春节前各家公司都跟打了鸡血似的,
DeepSeek更新了小版本,紧接着智谱GLM5发布、然后Minimax 2.5也跟进,再之后豆包2.0模型发布,国外那边OpenAI、Anthropic也是在前几周更新了..
整个2月就跟AI军备竞赛似的,每天醒来都有新东西要追,我的待测清单比年货清单还长..
我就纳闷了,整个晋西北都乱成一锅粥了,阿里干嘛呢。。
春节前这波密集发布,已经不是“卷不卷”的问题了,是你不发,市场就忘了你的问题。
但就在今天除夕当天,阿里直接丢了个重磅炸弹:
千问3.5,正式上线并开源发布。
千问官网已经可以体验最新3.5-Plus版本你没看错,除夕发新模型,这个节奏..阿里的同学属实是加班到位了。
给大家拜早年的同时,我忍不住第一时间测了一下..
来,先看个视频,直接用千问3.5搓了个塔防游戏,小伙伴们玩的都很爽哈哈哈
体验地址在后边!
这个Case里面融合了千问3.5的推理能力、Coding能力、Agent能力、多模态理解等综合方面的各个能力,一会给大家详细地去讲一下这个Case。
先说整体结论(纯个人主观):
- 千问3.5 架构层面有大提升,而且397B总参激活17B,速度直接拉满
- 原生多模态能力上线,对于网页复刻、细粒度图像识别做的比较到位
- 部分场景已经堪比Gemini3.0 Pro了,但是泛化能力上有待提高
- 文本能力似乎并没有太大提升,一会给大家看个Case
- 最关键的:全部开源,Apache 2.0 协议,发布即可用
接下来,我们一个个来看。
架构革新、开源、性价比超高
如果你关注过我之前的文章,你会知道我一直推荐千问系列。
不是因为“国产之光”这种标签,而是一个很现实的原因:
做企业本地化部署的时候,开源模型里首选就是千问。
为什么?
全尺寸开源,从 0.5B 到上百B 全覆盖,你能按照自己的算力条件和业务场景自由选型。这个之前就给大家说过,Apache 2.0 协议,商用无门槛。
而且阿里的生态支持:百炼平台、魔搭社区、各种衍生工具,让部署这件事的工程确定性非常高。
这就是「全链路生态」的优势。
所以当千问3.5发布的时候,我关心的不只是"强不强",更关心的是:
这次的架构升级,能不能让开源模型的天花板再往上捅一捅?
先说最核心的变化。
过去两年,大模型行业一直在信奉一件事:大力出奇迹。
参数从千亿堆向万亿,性能确实涨了,但代价也涨了。部署要专用集群,推理要烧算力,中小企业用不起,端侧设备更跑不动。
千问3.5换了一种思路:不比谁更大,比谁更聪明。
- 千问3.5引入了混合注意力机制,让模型根据信息的重要程度动态分配注意力资源,该略读的略读,该精读的精读。
- 千问3.5将稀疏混合专家架构推向了极致:397B 的总参数,每次推理只激活 17B。
- 上下文也扩展到了1M。同时将词表从150k扩展到250K,支持语言(方言)扩展到201种。
- 传统自回归模型每次只预测下一个 token,千问3.5在训练阶段就学会了对后续多个位置进行联合预测,推理速度大幅提升!
- 还做了一些深层优化包括注意力门控机制、归一化策略和专家路由初始化等等,共同确保架构创新在万亿级token训练中真正跑得通、跑得稳。
这项技术源自千问团队斩获 NeurIPS 2025 最佳论文 的门控注意力机制(Gated Attention),不是实验室阶段的论文,是已经落地到生产模型里的真技术。
当这些技术同时作用于一个模型,结果是什么?
“ 千问3.5 以 397B 总参数,每次激活仅 17B,实现与 GPT-5.2、Gemini-3-Pro 同级的性能表现。与上一代超万亿参数的 Qwen3-Max 相比,部署成本直降 60%,推理速度大幅提升。
Ag模型效果随着RL Environment scaling带来的增益说白了,以前你得花10块钱干的事,现在4块钱就搞定了,而且干得一样好。
对企业来说,这是真金白银的成本优化。
说完能力,来说价格。
先来看看传统榜单..这次模型在各种榜单上的指标,比Qwen3-Max-Thinking更强,但参数更少,更快,Tokens成本也打下去了,API价格每百万Token低至0.8元,仅为Gemini 3 pro的1/18。
最强性能 × 最低成本,第一次同时出现在同一个模型上。
而且千问3.5 还将语言支持扩展到了 201种,词表从150K扩展到250K,小语种编码效率最高提升60%。这对做全球化业务的团队来说,吸引力很大(出海赚美刀啊
后续还会开源不同尺寸、不同功能的模型,覆盖本地、端侧等各种部署场景。开发者、科研人员、中小企业都可以免费下载商用。
实测:用千问3.5一口气做了个塔防游戏
好了,数据和特性说了一堆,但我们懂的都懂,关注的一直都是它到底能不能干活?
这次我做了一个比较有趣的测试,把千问3.5接入 ClaudeCode,直接让它帮我开发一款塔防类游戏。
为什么选塔防?
当然因为有趣啊。。
哦不是,因为这类游戏的开发涉及多系统协同:地图网格系统、路径寻找、防御塔放置与升级、敌人波次生成、弹道计算、碰撞检测、经济系统、UI交互..
我的测试方式是这样的:
首先,我写了一个大概的需求Prompt,这个prompt也是千问3.5帮我写的,包含了地图设计、三种防御塔(箭塔、炮塔、冰塔)的完整参数、三种敌人(基础、快速、坦克)的属性、10波敌人的递进机制、经济系统和生命系统等等。
请帮我实现一个经典塔防策略小游戏。技术约束:纯 HTML + CSS + JavaScript,不依赖任何外部框架或库,单文件实现。
- 页面背景 #1A1A2E。游戏画布使用 Canvas,尺寸 800×560px 居中,背景为草地绿 #4A7C59。地图使用 20×14 的网格系统,每格40×40px。路径由预设的网格坐标序列定义(从左侧入口蜿蜒到右侧出口),路径格颜色为泥土色 #C4A35A,宽度占满整格,路径边缘加 1px 深色描边。非路径格为草地,可放置防御塔。
- 三种防御塔——箭塔:造价 50 金,攻击力 10,射程 120px,攻速 1 次/秒,弹道为从塔顶射出的棕色小三角(4×8px)直线飞向目标,速度 8px/帧,颜色 #8B4513,塔身为灰色 #778899方块上一个三角形塔顶;炮塔:造价 100 金,攻击力 30,射程 100px,攻速 0.5 次/秒,弹道为黑色圆球 5px 半径抛物线飞行,命中时产生橙红色爆炸圆(半径从 5 扩大到 20px,200ms淡出),范围伤害半径 30px,塔身为深灰 #444 粗方柱;冰塔:造价 75 金,攻击力 5,射程 110px,攻速 0.8 次/秒,命中后减速目标 50%(持续 2 秒),弹道为浅蓝 #87CEEB 菱形,塔身冰蓝色#ADD8E6。每种塔可升级两次,每次升级花费为建造费的 60%,攻击力 +40%、射程 +15%。
- 敌人系统:共 10 波,每波间隔 15 秒(有倒计时显示)。敌人沿路径匀速行走。基础敌人:红色圆 12px 半径,血量 50,速度 1.5px/帧;快速敌人:黄色小圆 8px,血量 30,速度3px/帧;坦克敌人:紫色大圆 16px,血量 200,速度 0.8px/帧。每波敌人数量从 5 递增到 20,后期混合出现。敌人头顶显示红色血条(宽 24px,高 3px)。
- 经济与生命系统:初始金币 200,击杀敌人奖励 10-25 金。初始生命 20,敌人到达终点扣 1 点生命,归零则游戏结束弹出半透明黑色遮罩和"Game Over"文字(红色 60px)及"重新开始"按钮。画布上方HUD 显示:波次、金币、生命值,字号 18px 白色。右侧塔选择面板用三个带图标按钮表示。
然后把生成的代码直接丢到 ClaudeCode 里跑。
结果让我挺意外的。
第一把跑整个游戏的完成度非常高:
- ✅ 蜿蜒的路径渲染正确,敌人沿路径移动流畅
- ✅ 三种防御塔的攻击方式、弹道轨迹都按要求实现
- ✅ 炮塔的范围爆炸、冰塔的减速效果都在
- ✅ 敌人波次递进,后期混合出现不同类型
- ✅ 经济系统正常运转,升级机制可用
这是第一版的界面,整体的运行机制和逻辑是没问题的,
但是一个游戏,当然要讲究画面的精美度了,然后我又用千问3.5帮我根据游戏界面的元素,生成了一批prompt,找了惯用的AI绘画Agent跑了一遍游戏素材图。
之后打包下载到项目所在目录,直接放到resources文件夹下。
之后我让它查找该目录 resource 文件夹下的所有游戏截图,文件名即为对应的含义。请你按照我们刚才设计的游戏,把页面上所有的动态效果和游戏素材,全部替换成本文件里的图片。
它就开始逐一检查文件夹里面的图片,跟游戏中的对应关系,然后做出修改。
生成了第二版,
在这中间我还跟它对话了很多次,包括我觉得画面分配有问题,直接截图告诉千问3.5,让它进行调整。
漏了很多对话没有截图....被CC压缩了在这里我还跟它对话了好几次,每次都是在游戏界面里面把截图发给 千问3.5,然后他就基于截图内容进行修改,并调用各种工具去执行。
它的 Agent 能力和多模态理解能力,在这方面起到了很大的作用。
经过了几轮对话之后,最终得到了完整的游戏画面!
从第1波的轻松防守,到后面几波被"坦克敌人"压着打,游戏体验的节奏感居然还不错..
之后,我把它降低了难度...
我还专门为此录了一个完整的游戏通关过程视频。
其实还有一些视觉细节可以打磨得更精致。
但作为几个Prompt出来的游戏,这个完成度我给高分。
这个其实就是模型推理能力、Agent 能力和多模态能力综合测试下来的一个结果,效果还是很不错的。
试玩链接🔗在这里了http://47.90.249.184/game/tower-defense-v3.html,欢迎PC端体验!
除了这个场景之外,我还测了「迷宫生成与寻路算法可视化」
请帮我实现一个迷宫生成与寻路算法可视化的交互页面。技术约束:纯 HTML + CSS + JavaScript,不依赖任何外部框架或库,单文件实现。
- 页面整体背景色 #1A1A2E,分为左侧控制面板(宽 260px,背景 #16213E,内边距 20px)和右侧迷宫画布区域。迷宫使用 Canvas 绘制,画布居中显示,默认迷宫规格 25×25 格,每格大小 22px,墙壁宽度2px。墙壁颜色 #0F3460,通道颜色 #1A1A2E,起点(左上角)标记为绿色 #00FF7F 方块,终点(右下角)标记为红色 #FF4757 方块。
- 迷宫生成算法采用 DFS 递归回溯法。
- 求解算法提供三种选择,用单选按钮组切换:A* 算法、BFS 广度优先、DFS 深度优先。可视化配色方案——已探索并关闭的节点:#533483(紫色),当前开放列表/队列中的节点:#E94560(粉红),当前正在探索的节点:#FFDD57(亮黄色,尺寸稍大闪烁),最终最短路径:#00FF7F(翠绿色)加粗显示。求解速度同样可调,滑块范围 1-50步/帧。每种算法执行完毕后,在画布下方显示统计信息:探索节点数、路径长度、耗时(毫秒),字体 Consolas 14px 白色。
- 控制面板包含:迷宫大小下拉选择(15×15 / 25×25 / 35×35 / 51×51)、生成速度滑块、求解速度滑块、"生成迷宫"按钮(背景 #E94560,白色字,圆角 8px)、"开始求解"按钮、"重置"按钮。底部放置算法说明区域,用折叠面板呈现三种算法的简要描述,字号 12px,颜色 #A0A0C0。整个动画逐帧绘制使用 requestAnimationFrame 配合步进计数器控制速度。
效果也很不错。
还有多模态理解的图片,拿聪哥之前用的图片做了个测试:
结果回答正确
以及,我用千问3.5直接用我的「杂志排版Skill」生成的杂志风格图片。
理解、执行、推理,测下来都非常丝滑,推理速度变得非常快..
结语
测下来,源神千问3.5的确有点东西。
在除夕这天发布,其实也挺应景的,
你看这一年,DeepSeek、千问、智谱、文心、混元、Kimi、Minimax、豆包..
国内AI行业,真的是百花齐放,共贺新春。
这不是某一家独大的故事,是整个行业在狂奔。
千问,也给乙巳年最后,画上了一个圆满的句号!
新春快乐,源力觉醒。
期待千问在新的一年继续往前冲。
也期待我们国内的AI,
越来越强。
再次祝大家新年快乐!!!!!
以上。 |