GLM-5.2：给国产模型追赶Anthropic 又提了一口气｜附实测

ycp123 · 发表于 2026-6-14 16:09

马上注册，查看更多内容，享用更多功能，让你轻松玩转社区。

您需要登录才可以下载或查看，没有账号？注册

×

作者｜董道力
邮箱｜dongdaoli@pingwest.com开源，曾是美国科技产业最值得骄傲的发明之一。
1984 年，麻省理工学院人工智能实验室里，一位留着大胡子、眼神倔强的程序员彻底被激怒了。打印机坏了，厂商却不肯交出源码。他一气之下辞掉体面的工作，写下 GNU 宣言。Richard Stallman 或许不会想到，这份带着理想主义怒气的檄文，会在接下来的四十年里，重塑整个软件世界的权力格局。
美国曾经是开源运动最肥沃的土壤。1991 年，一个芬兰学生在 Usenet 上发布了一段操作系统内核代码，但真正让 Linux 从极客玩具变成全球互联网基础设施的，是美国企业的接力和背书。IBM 投入十亿美元，Red Hat 靠它上市，Google 用它跑起了搜索帝国。
然后，时间来到 2026 年 6 月 11 日。
一封来自美国商务部长的信，寄到了 Anthropic CEO Dario Amodei 的案头。信件内容很短，语气却不容置疑：以国家安全权限为由，暂停所有外国人对 Fable 5 和 Mythos 5 模型的访问。限制范围极广，不仅包括境外用户，也包括身在美国境内的外国人，甚至包括 Anthropic 自己的外籍员工。没有公开技术细节，没有申诉窗口，48 小时内执行。
两天后，6 月 13 日，智谱发布声明：GLM-5.2，将于下周正式开源。它支持 100 万 token 上下文，是智谱目前最强模型，采用 MIT 协议，无任何地域限制。
官方声明里这样写到：

“在一些前沿模型突然变得不可用的时刻，我们选择了另一条路：前沿智能不应只属于少数人，也不应被少数规则随时收回。它应该开放、可用、可构建，并服务于每一位开发者。”

来自中国的开源模型，已经成了这一轮AI浪潮里，开放普惠的代表。他们在努力提供紧跟前沿闭源模型的能力给所有人，而现在是时候更加高举高打和更激进的推动这件事了。

当然，宏大叙事归宏大叙事。GLM-5.2 到底好不好用，最终还是要靠实测说话。
以下是我们第一时间的实测。
我们选了智谱刚刚发布的 ZCode 3.0 作为测试台。它全面切换了自研的 ZCode Agent 内核，对满血 GLM 做了深度优化，长程推理、工具调用和大型工程执行链路都针对 GLM 系列做了专门调校。
1
测试 1：动态月相时钟

Plain Text请用 HTML/CSS/JavaScript 写一个复杂的纯 SVG 动画，不使用 Canvas，不使用外部图片。主题是“机械天文钟”。要求：SVG 中包含至少 5 个同心圆层级：外圈刻度环、星轨环、齿轮层、月相层、中心指针层。至少有 6 个齿轮，其中相邻齿轮旋转方向相反，转速不同，齿轮必须有真实齿形，不要只画普通圆。外圈要有 60 个分钟刻度和 12 个小时刻度，刻度必须用程序生成或结构化生成。星轨上有若干光点沿椭圆轨道运动，运动路径要平滑。月相盘需要周期性变化，至少表现新月、半月、满月之间的过渡。中心有三根指针，分别以不同速度旋转。加入 hover 交互：鼠标移到不同环层时，该层高亮并显示简短标签。加入控制面板：暂停/继续动画、调节速度、切换日夜主题。视觉上要精致，有渐变、阴影、发光或滤镜，但不能影响可读性。代码要结构清晰，避免重复，动画性能稳定。最终输出一个可直接运行的完整 HTML 文件。

GLM5.2 以单 HTML 文件完成了一座机械天文钟，约 925 行纯前端代码，零外部依赖。技术栈越薄，视觉的担子越重——齿轮齿形、月相明暗线、星轨椭圆，全靠 SVG path 一笔笔算出来，没有贴图，没有 Canvas 兜底。
它没有走"挤牙膏"式的增量开发，第一发就一口气写完整整 900 行骨架：五层同心 SVG、七颗齿轮、60 分钟刻度、椭圆星轨、月相盘、三速度指针、控制面板全部搭通，首版打开即转。
随后它自己 review 了一遍代码，挖出三个真 bug 并逐一修复。
最值得一提的是，GLM5.2 不堆屎山，发现错了敢整段重写。
以月相为例，第一个版本 GLM5.2 用的是 mask 配一个位移缩放的阴影圆，函数里还留着多行被注释掉的试错推导，半月时分界不是直线，新月时压根遮不住。它没有继续在 mask 上凑手感，而是直接推倒，换成 terminator 双弧 path。改完不靠感觉验收，而是拿四个边界相位打表验证：新月亮区恰好为零、上弦右半圆、满月整圆、下弦左半圆，全部吻合。

但 GLM5.2 生成的时钟，颜值上就很有进步空间了。
1
测试 2：互动点球大战

Plain Text写一个单文件 HTML，用 Three.js + Cannon.js 做 3D 互动点球大战游戏。场景：- 逼真的球门和点球点，球场草地，后方看台有模糊的观众剪影- 3D 足球（带纹理），守门员（简化骨骼模型或人形）站在门线上玩法：- 射门阶段（玩家）：- 鼠标拖拽控制射门方向（左右+上下弧线），拖拽距离决定力量- 松开鼠标射门，足球按物理轨迹飞行（初速度 + 旋转引起的马格努斯效应弧线）- 显示瞄准辅助线（虚线抛物线预测轨迹）- 扑救阶段（AI）：- 守门员根据射门方向实时判断扑救方向- AI 难度可调：简单（扑救延迟 0.3s）、普通（0.15s）、困难（几乎瞬发但有 5% 失误率）- 五轮制，每轮交替玩家射门和 AI 射门（AI 射门时玩家控制守门员左右移动+起跳扑救）视觉效果：- 足球旋转时纹理清晰可见- 射门力量大时镜头轻微震动- 进球后：球网物理摆动（Cannon.js 软体模拟或顶点动画），观众席粒子欢呼特效，比分牌翻转- 扑出后：守门员做出扑球动作，球弹出底线计分板：左上角显示玩家 vs AI 比分，射进/射失统计输出：完整可运行的单 HTML 文件（Cannon.js CDN）。

GLM5.2 生成的游戏内容相当完整：五轮攻防、三档 AI 难度、拖拽射门配马格努斯弧线、AI 预判扑救、加时赛一应俱全。视觉上，草地是程序生成的，足球用真五边形拼接而成，1400 个观众剪影批量渲染。
值得关注的，是 GLM5.2 的开发思路：先让游戏能玩，再慢慢打磨。
第一步就把完整骨架搭了起来：射门、扑救、判定、回合切换全部跑通。后续遇到问题，每次修复都遵循一套清晰流程：发现问题 → 挖根因 → 给方案 → 调数值 → 跑语法检查。
举个例子。CapsuleGeometry 在老版本 Three.js 里并不存在，GLM5.2 直接诊断出 r128 的 LatheGeometry 是 ES6 class、不能用 .call() 借调，于是改用 extends + super，然后逐个验证：构造成功、形状正确、node --check 通过。
GLM5.2 还会根据语言特性做针对性设计，像个有经验的老手。比如守门员被刻意不放进物理引擎，而是手写距离检测，巧妙避开了 Cannon.js 那种鬼畜弹跳，彻底解决了"球穿门将"的 bug。
最值得一提的，是它做动画优化的方式，直接找专业文献。
门将扑救动作的早期版本很僵硬：先是"起跳"，再改成"横飞"，还是不够自然。GLM5.2 没有凭感觉硬调，而是去查了 Ibrahim et al。（2019）等关于西甲精英门将扑救生物力学的研究，直接从论文里提取出真实的时间参数——对侧腿蹬地发力 0.12 秒 → 重心横移 0.18 秒 → 手臂鞭打伸展 0.25 秒。
据此，它把动画拆成三阶段重写：身体压缩蓄力 → 躯干弹射横移 → 手臂直线伸展够球。每一帧的旋转方向都用数值方法验证过，确保脚、腿、躯干、手始终成一条直线、朝着球飞去。
我把 GLM5.2 引用的每个数据源都打开检查过，一个也没有瞎编，都是真实存在的网页。

1
测试 3：做一个迷你 Excel
这个项目主要让GLM5.2做一个零依赖、单文件 HTML 的简化版 Excel，可在浏览器中直接打开运行，具备核心电子表格能力：网格编辑、公式引擎、撤销重做、剪贴板、CSV 导入导出等，是一个比较综合的项目。

GLM-5.2 跑了一小时，把 Excel 桌面端核心体验——用浏览器还原。
可以实现完整的编辑功能，单击/双击/Enter 切换状态，方向键、Tab、PageUp/Down、Ctrl+Home 全套快捷键等。用 TS实现公式引擎，递归下降解析 + 相对/绝对/混合引用 + 30+ 函数。常用的工具栏，像加粗/斜体/对齐、5 种数字格式、60 步撤销重做。

参考这个项目来看，GLM-5.2 并非没有问题，它在架构设计上有相当扎实的工程能力，但执行节奏严重失衡。比如14 分钟过去，可见产出还停留在"设计讨论 + 零散代码片段"，从未真正写出可运行的 HTML 文件。
换句话说，GLM-5.2 是一个想得很多的模型。三思而后行是优点，但如果最后没把功能跑出来，再深的思考也只停留在原地。
我在使用的时候，经常会怀疑是不是模型卡住了，忍不住让其暂停，再输入继续指令。

1
写在最后
客观来看，GLM-5.2 与 Claude 等国际顶尖模型相比，仍然存在差距。它的界面审美有待提升，复杂任务中有时会长时间思考，迟迟不输出可运行代码。
但重要的是，它证明了另一件事：国产大模型已经具备了实实在在的工程能力。
GLM-5.2 能在无外部依赖的情况下，一次生成 900 多行可运行的 SVG 机械钟代码；能在发现自身 bug 后主动推倒重写；能在 Three.js 和 Cannon.js 的技术坑里自主定位问题；也能花费一小时，在纯浏览器环境中复刻 Excel 的核心体验。
更关键的是，智谱选择了一条稳定开源的路线。
GLM-5.2 让“能用的国产模型”从口号变成了可运行的代码。用户不需要申请特殊权限，不必担心某天清晨醒来发现 API 被突然掐断，也不需要在阅读文档前签署一份出口合规声明。
它在此前已经是国产模型coding最强之一的GLM-5.1基础上，又有明显进步，整体变得更加能打。
在Anthropic和OpenAI最近的模型眼看又要拉开和其他模型差距的时刻，GLM-5.2的出现的确能给所有国产模型提一口气。

账号		自动登录	找回密码
密码			注册

[科技新闻] GLM-5.2：给国产模型追赶Anthropic 又提了一口气｜附实测

马上注册，查看更多内容，享用更多功能，让你轻松玩转社区。