夜间模式 切换到宽版

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 110|回复: 0

[科技新闻] GLM-5.2:给国产模型追赶Anthropic 又提了一口气|附实测

[复制链接]
  • 打卡等级:功行圆满
  • 打卡总天数:834
发表于 2026-6-14 16:09 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
1.webp
作者董道力
邮箱dongdaoli@pingwest.com开源,曾是美国科技产业最值得骄傲的发明之一。
1984 年,麻省理工学院人工智能实验室里,一位留着大胡子、眼神倔强的程序员彻底被激怒了。打印机坏了,厂商却不肯交出源码。他一气之下辞掉体面的工作,写下 GNU 宣言。Richard Stallman 或许不会想到,这份带着理想主义怒气的檄文,会在接下来的四十年里,重塑整个软件世界的权力格局。
美国曾经是开源运动最肥沃的土壤。1991 年,一个芬兰学生在 Usenet 上发布了一段操作系统内核代码,但真正让 Linux 从极客玩具变成全球互联网基础设施的,是美国企业的接力和背书。IBM 投入十亿美元,Red Hat 靠它上市,Google 用它跑起了搜索帝国。
然后,时间来到 2026 年 6 月 11 日。
一封来自美国商务部长的信,寄到了 Anthropic CEO Dario Amodei 的案头。信件内容很短,语气却不容置疑:以国家安全权限为由,暂停所有外国人对 Fable 5 和 Mythos 5 模型的访问。限制范围极广,不仅包括境外用户,也包括身在美国境内的外国人,甚至包括 Anthropic 自己的外籍员工。没有公开技术细节,没有申诉窗口,48 小时内执行。
两天后,6 月 13 日,智谱发布声明:GLM-5.2,将于下周正式开源。它支持 100 万 token 上下文,是智谱目前最强模型,采用 MIT 协议,无任何地域限制。
官方声明里这样写到:
“在一些前沿模型突然变得不可用的时刻,我们选择了另一条路:前沿智能不应只属于少数人,也不应被少数规则随时收回。它应该开放、可用、可构建,并服务于每一位开发者。”
来自中国的开源模型,已经成了这一轮AI浪潮里,开放普惠的代表。他们在努力提供紧跟前沿闭源模型的能力给所有人,而现在是时候更加高举高打和更激进的推动这件事了。
2.webp
当然,宏大叙事归宏大叙事。GLM-5.2 到底好不好用,最终还是要靠实测说话。
以下是我们第一时间的实测。
我们选了智谱刚刚发布的 ZCode 3.0 作为测试台。它全面切换了自研的 ZCode Agent 内核,对满血 GLM 做了深度优化,长程推理、工具调用和大型工程执行链路都针对 GLM 系列做了专门调校。
1
测试 1:动态月相时钟















Plain Text请用 HTML/CSS/JavaScript 写一个复杂的纯 SVG 动画,不使用 Canvas,不使用外部图片。主题是“机械天文钟”。要求:SVG 中包含至少 5 个同心圆层级:外圈刻度环、星轨环、齿轮层、月相层、中心指针层。至少有 6 个齿轮,其中相邻齿轮旋转方向相反,转速不同,齿轮必须有真实齿形,不要只画普通圆。外圈要有 60 个分钟刻度和 12 个小时刻度,刻度必须用程序生成或结构化生成。星轨上有若干光点沿椭圆轨道运动,运动路径要平滑。月相盘需要周期性变化,至少表现新月、半月、满月之间的过渡。中心有三根指针,分别以不同速度旋转。加入 hover 交互:鼠标移到不同环层时,该层高亮并显示简短标签。加入控制面板:暂停/继续动画、调节速度、切换日夜主题。视觉上要精致,有渐变、阴影、发光或滤镜,但不能影响可读性。代码要结构清晰,避免重复,动画性能稳定。最终输出一个可直接运行的完整 HTML 文件。
3.webp
GLM5.2 以单 HTML 文件完成了一座机械天文钟,约 925 行纯前端代码,零外部依赖。技术栈越薄,视觉的担子越重——齿轮齿形、月相明暗线、星轨椭圆,全靠 SVG path 一笔笔算出来,没有贴图,没有 Canvas 兜底。
它没有走"挤牙膏"式的增量开发,第一发就一口气写完整整 900 行骨架:五层同心 SVG、七颗齿轮、60 分钟刻度、椭圆星轨、月相盘、三速度指针、控制面板全部搭通,首版打开即转。
随后它自己 review 了一遍代码,挖出三个真 bug 并逐一修复。
最值得一提的是,GLM5.2 不堆屎山,发现错了敢整段重写
以月相为例,第一个版本 GLM5.2 用的是 mask 配一个位移缩放的阴影圆,函数里还留着多行被注释掉的试错推导,半月时分界不是直线,新月时压根遮不住。它没有继续在 mask 上凑手感,而是直接推倒,换成 terminator 双弧 path。改完不靠感觉验收,而是拿四个边界相位打表验证:新月亮区恰好为零、上弦右半圆、满月整圆、下弦左半圆,全部吻合。
4.webp
但 GLM5.2 生成的时钟,颜值上就很有进步空间了。
1
测试 2:互动点球大战






















Plain Text写一个单文件 HTML,用 Three.js + Cannon.js 做 3D 互动点球大战游戏。场景:- 逼真的球门和点球点,球场草地,后方看台有模糊的观众剪影- 3D 足球(带纹理),守门员(简化骨骼模型或人形)站在门线上玩法:- 射门阶段(玩家):- 鼠标拖拽控制射门方向(左右+上下弧线),拖拽距离决定力量- 松开鼠标射门,足球按物理轨迹飞行(初速度 + 旋转引起的马格努斯效应弧线)- 显示瞄准辅助线(虚线抛物线预测轨迹)- 扑救阶段(AI):- 守门员根据射门方向实时判断扑救方向- AI 难度可调:简单(扑救延迟 0.3s)、普通(0.15s)、困难(几乎瞬发但有 5% 失误率)- 五轮制,每轮交替玩家射门和 AI 射门(AI 射门时玩家控制守门员左右移动+起跳扑救)视觉效果:- 足球旋转时纹理清晰可见- 射门力量大时镜头轻微震动- 进球后:球网物理摆动(Cannon.js 软体模拟或顶点动画),观众席粒子欢呼特效,比分牌翻转- 扑出后:守门员做出扑球动作,球弹出底线计分板:左上角显示玩家 vs AI 比分,射进/射失统计输出:完整可运行的单 HTML 文件(Cannon.js CDN)。
5.webp
GLM5.2 生成的游戏内容相当完整:五轮攻防、三档 AI 难度、拖拽射门配马格努斯弧线、AI 预判扑救、加时赛一应俱全。视觉上,草地是程序生成的,足球用真五边形拼接而成,1400 个观众剪影批量渲染。
值得关注的,是 GLM5.2 的开发思路:先让游戏能玩,再慢慢打磨。
第一步就把完整骨架搭了起来:射门、扑救、判定、回合切换全部跑通。后续遇到问题,每次修复都遵循一套清晰流程:发现问题 → 挖根因 → 给方案 → 调数值 → 跑语法检查。
举个例子。CapsuleGeometry 在老版本 Three.js 里并不存在,GLM5.2 直接诊断出 r128 的 LatheGeometry 是 ES6 class、不能用 .call() 借调,于是改用 extends + super,然后逐个验证:构造成功、形状正确、node --check 通过。
GLM5.2 还会根据语言特性做针对性设计,像个有经验的老手。比如守门员被刻意不放进物理引擎,而是手写距离检测,巧妙避开了 Cannon.js 那种鬼畜弹跳,彻底解决了"球穿门将"的 bug。
最值得一提的,是它做动画优化的方式,直接找专业文献。
门将扑救动作的早期版本很僵硬:先是"起跳",再改成"横飞",还是不够自然。GLM5.2 没有凭感觉硬调,而是去查了 Ibrahim et al。 (2019) 等关于西甲精英门将扑救生物力学的研究,直接从论文里提取出真实的时间参数——对侧腿蹬地发力 0.12 秒 → 重心横移 0.18 秒 → 手臂鞭打伸展 0.25 秒。
据此,它把动画拆成三阶段重写:身体压缩蓄力 → 躯干弹射横移 → 手臂直线伸展够球。每一帧的旋转方向都用数值方法验证过,确保脚、腿、躯干、手始终成一条直线、朝着球飞去。
我把 GLM5.2 引用的每个数据源都打开检查过,一个也没有瞎编,都是真实存在的网页。
6.webp
7.webp
1
测试 3:做一个迷你 Excel
这个项目主要让GLM5.2做一个零依赖、单文件 HTML 的简化版 Excel,可在浏览器中直接打开运行,具备核心电子表格能力:网格编辑、公式引擎、撤销重做、剪贴板、CSV 导入导出等,是一个比较综合的项目。
8.webp
GLM-5.2 跑了一小时,把 Excel 桌面端核心体验——用浏览器还原。
可以实现完整的编辑功能,单击/双击/Enter 切换状态,方向键、Tab、PageUp/Down、Ctrl+Home 全套快捷键等。用 TS实现公式引擎,递归下降解析 + 相对/绝对/混合引用 + 30+ 函数。常用的工具栏,像加粗/斜体/对齐、5 种数字格式、60 步撤销重做。
9.webp
参考这个项目来看,GLM-5.2 并非没有问题,它在架构设计上有相当扎实的工程能力,但执行节奏严重失衡。比如14 分钟过去,可见产出还停留在"设计讨论 + 零散代码片段",从未真正写出可运行的 HTML 文件。
换句话说,GLM-5.2 是一个想得很多的模型。三思而后行是优点,但如果最后没把功能跑出来,再深的思考也只停留在原地。
我在使用的时候,经常会怀疑是不是模型卡住了,忍不住让其暂停,再输入继续指令。
10.webp
1
写在最后
客观来看,GLM-5.2 与 Claude 等国际顶尖模型相比,仍然存在差距。它的界面审美有待提升,复杂任务中有时会长时间思考,迟迟不输出可运行代码。
但重要的是,它证明了另一件事:国产大模型已经具备了实实在在的工程能力。
GLM-5.2 能在无外部依赖的情况下,一次生成 900 多行可运行的 SVG 机械钟代码;能在发现自身 bug 后主动推倒重写;能在 Three.js 和 Cannon.js 的技术坑里自主定位问题;也能花费一小时,在纯浏览器环境中复刻 Excel 的核心体验。
更关键的是,智谱选择了一条稳定开源的路线。
GLM-5.2 让“能用的国产模型”从口号变成了可运行的代码。用户不需要申请特殊权限,不必担心某天清晨醒来发现 API 被突然掐断,也不需要在阅读文档前签署一份出口合规声明。
它在此前已经是国产模型coding最强之一的GLM-5.1基础上,又有明显进步,整体变得更加能打。
在Anthropic和OpenAI最近的模型眼看又要拉开和其他模型差距的时刻,GLM-5.2的出现的确能给所有国产模型提一口气。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )

GMT+8, 2026-6-15 01:03 , Processed in 0.440195 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表