马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有账号?注册
×
刚刚,META 的股价一度暴涨超 10%:
而原因,则是一个叫 Alexandr Wang 的 28 岁年轻人,在 X 上发了一个九条推文的长帖。
Alexandr Wang 发布 Muse Spark 的推文截图Meta Superintelligence Labs 的第一个模型,Muse Spark,出来了。
Alexandr Wang 在帖子开头写的第一句话,也是整件事的底色:
“ 九个月前,我们从头重建了整套 AI 基座。新的基础设施、新的架构、新的数据流水线。Muse Spark 就是这些工作的结果,它现在也为 Meta AI 提供动力了。
九个月,从零开始,终于交作业了。
01先看效果
Muse Spark 是一个原生多模态推理模型,支持 tool-use、视觉思维链(visual chain of thought),以及多智能体编排。
Muse Spark 模型概述图用白话来说:
给它一张图,它能看懂;给它一个复杂问题,它知道该调用什么工具;让它协调多个任务同时跑,它也能搞定。
MSL 的研究员 Matt Deitke 给了一个直观演示:
把一张数独棋盘的照片发给 Muse Spark,它自己调用 Python 工具,直接生成了一个可以在网页上玩的数独游戏。
从视频中可以看到,模型读入图片后,把棋盘里的图标(太阳、鳄梨、山、风等符号)原样保留,生成了一个带有 Hint、Check、Solve、Undo 按钮的完整网页应用,起始格锁定,点击空格就能填入对应图标。
33 秒之内,这个 Icon Sudoku 就可以玩通了。
Muse Spark 数独 demo:模型生成可玩网页游戏
数独游戏完成界面(用时 33 秒通关)02沉思模式
Alexandr Wang发布的另一个功能是 Contemplating Mode(沉思模式)。
它让多个智能体并行推理,专门用来处理复杂的科学和数学问题。内部测试的说法是,它和 Gemini Deep Think、GPT Pro 这类极限推理模型的表现相当。
Contemplating Mode 架构示意图Meta AI 现在有三种模式:
Instant(快速响应)、Thinking(深度推理),以及新上线的 Shopping 模式,读取你在 Meta 旗下应用里刷过的创作者、品牌和穿搭内容,直接转化成购物建议。
Matt Deitke 还发推说,Grounding(视觉定位)功能已经推送到了生产环境。
从 demo 视频里可以看到:用户上传了一张家用咖啡机(Micra + Grinder)的照片,模型不仅识别出了机器的各个零件(粉碗、压粉器等),还在图片上用红框标注出对应位置,同步生成了从研磨到倒奶泡的完整操作步骤。
Grounding 演示:识别咖啡机零件并标注位置Muse Spark Grounding 视觉定位功能演示:
03Alexandr Wang 是谁
Alexandr Wang,1997 年出生于新墨西哥州,父母是在洛斯阿拉莫斯国家实验室工作的华裔物理学家。
他 19 岁从 MIT 退学,和联合创始人共同创立了 Scale AI。
Scale 做的事情,说起来其实不怎么性感:替 AI 行业处理数据标注和数据流水线管理。有点像给建筑队供砖,不出现在媒体上,但几乎所有大模型的训练数据,多少都走过 Scale 的数据引擎。
Pentagon 选过 Scale 来评估大型语言模型,各大 AI 公司都是他们的客户,美国政府也不例外。
2021 年,Scale AI 估值 73 亿美元,Alexandr Wang在 24 岁成为亿万富翁;第二年被认定为全球最年轻的白手起家亿万富翁。
2025 年 6 月,Meta 以约 143 亿美元拿下了 Scale AI 49% 的股份。
Alexandr Wang卸任 Scale AI CEO,成为 Meta 历史上第一位首席 AI 官(Chief AI Officer),领导新成立的 Meta Superintelligence Labs(MSL)。
04传闻与辟谣
他入职之后,事情并不太平。
到任仅两个月,他亲自从 Scale 带过来的高管 Ruben Mayer 就以「个人原因」离职了。同一时期,有报道说 MSL 的研究人员认为 Scale 的数据质量不够好,悄悄换用了竞争对手来处理训练数据,这对整个收购的逻辑来说……有点讽刺。
2025 年 12 月,《金融时报》报道,Alexandr Wang曾私下向同事抱怨:扎克伯格的微管理让他感到「窒息」,拖慢了进度。
2026 年 1 月,从 Meta 离职的「AI 教父」Yann LeCun 在接受《金融时报》采访时公开批评Alexandr Wang:
“ 他年轻,没有经验。他没有从事过研究,不知道研究是怎么做的,也不知道什么对研究人员有吸引力。
LeCun 也补了一句:「他学得快,知道自己不知道什么。」
一褒一贬,也算是给了个客观完整的画像。
而上个月,有媒体报道扎克伯格将Alexandr Wang架空。
Meta 发言人 Andy Stone 后续回应称:
“ 完全是假的。Alex 参与创建了新团队,仍然运营着 MSL 和 TBD,影响力在增长而非减退。这太荒谬了。
扎克伯格随后放出了和 Alexandr Wang 的合照。
05被挖来的人
Muse Spark 当然不只是Alexandr Wang一个人的成绩。
MSL 的首席科学家赵盛佳,也同步宣布了发布。他来自 OpenAI,此前是 OpenAI 的 MTS(Member of Technical Staff),博士毕业于斯坦福。
赵盛佳发布配图赵盛佳发推说:
“ 很高兴分享我们在 Meta Superintelligence Labs 一直在做的事情。我们刚刚发布了 Muse Spark,这是我们的第一个 AI 模型,也是我们迈向个人超级智能的第一步。我们把整套技术栈都翻新了,以支持规模化,而这只是个开始。
Alexandr Wang到任之后,据报道开出了高达十亿美元的签字奖金来挖人,从 OpenAI 和各大顶尖机构广撒网。
可以说,赵盛佳就是这场抢人大战的战果之一。
06Benchmark 有点说法
模型发布了,评论区的质疑也跟着来了。
注意看下图的高亮分数:
Benchmark 对比(自家评分高亮分标注版)眼尖的网友 Nathan Spencer 索性给出了一张把各项第一名都加深标注的版本,配文「帮你们修好了」,直观地展示了哪些项目 Muse Spark 排名第一,哪些项目其他模型得分更高。
Nathan Spencer 标注各项最高分的 benchmark 对比图Shrey Shah 在评论区问道:
“ 在整个 benchmark 展示里,你们把自家的分数都高亮了,包括竞争对手得分比你们更高的那些项目。你们是在故意误导大家对性能的认知吗?
用户 Raksa 也发现,Gemini 3.1 Pro 在某些项目上的得分高于 Muse Spark,开始对模型的实际表现产生疑问。
除了 benchmark 展示方式的问题,还有一个更基础的困境:目前 Muse Spark 没有开放 API,没有公开权重,也没有关于模型规模的任何信息。
评论区已经有人在问了:「除了一篇博客,你们到底发了什么?」
这个问题……目前暂无正式的回答。
安全评估结果图表发布文章里,甚至还像模像样地专门提到了安全评估:在生物武器、化学武器等高风险领域,Muse Spark 表现出了强拒绝行为。
Humanity's Last Exam 上,Contemplating 模式跑到了 58%;FrontierScience Research 上是 38%。
07华尔街投票了
无论评论区怎么质疑,资本市场的态度却是一目了然:
META 股价走势图(公告后涨幅 +9%)META 当天涨了 8-9%,甚至一度超过 11%。
以一个第三方数字来收尾:Polymarket 上「Meta 在 6 月 30 日前拥有第一名 AI 模型」的赔率是 4%。
Alexandr Wang 最后写了这么一段:
“ 这是 MSL 的第一个模型,在模型行为上肯定还有不少粗糙的地方,我们会随着时间慢慢打磨。不管怎样,我们很期待大家来试试。
九个月,从头重建,第一个模型。
但「从头重建的 AI 基座」究竟有多强……要等 API 开放、权重公布之后,才能算真正交卷。
这份答卷,你怎么看?
◇ ◆ ◇ |