找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 11|回复: 11

[科技新闻] 美团的龙猫,放出来了

[复制链接]
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-9-2 00:08 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
中国的两大外卖巨头,开始在开源模型领域叫阵。
周末,美团低调开源LongCat-Flash,号称在智能体工具调用、指令遵循等部分测评上的表现,超越了阿里巴巴Qwen3-MoE-2507。数年来,王兴对AI的野心与布局,终于浮出水面。
1.webp


美团所图不小。2015年,美团曾试图通过云计算,参与产业互联网;2025年,美团再次主动进攻,试图通过智能计算,将连接线上场景与线下场景的美团,转型为连接数字世界与物理世界的平台。
为此,LongCat(龙猫)必须自研,且必须是前沿模型。
高效MoE架构

这是LongCat-Flash的首次公开亮相。年初,在2024年年报电话会议上,王兴透露过LongCat的存在。尽管是后来者,尽管是初代模型,但技术报告开篇就从“扩展定律”放缓切题,显得野心勃勃。毫无疑问,它是朝着前沿模型竞争来的。
要继续推进前沿,无论是算法设计、底层系统优化,还是数据策略,都还大有可为。美团这次将LongCat-Flash的尝试,放在了计算效率和智能体能力上。
LongCat-Flash拥有5600亿总参数规模,是一个混合专家(MOE)模型。不过,与传统的MOE模型不同,它在处理每个任务时,能够根据不同的上下文需求,动态地将激活186亿至313亿的参数(平均约270亿)。得益于在性能与效率上的平衡,如果基于H800,它的推理速度超过100 token/s,推理成本低至0.7美元/百万token(输出)。
按需分配,已是前沿模型的标配。无论是DeepSeek的V3.1,融合了思考模式和非思考模式,还是作为“统一系统”的GPT-5,由实时路由选择子模型,都尝试动态调度算力资源,消耗更少的token,花费更短的时间,达到相似的结果。LongCat-Flash也是,只不过,这次是在MOE模型架构内部。
“零计算专家”(ZCEs)是其中的一项关键技术。对于简单问题,这些特殊的专家在接收到输入的token后,将直接输出输入本身(即恒等映射),不做任何复杂运算,几乎不消耗额外算力。但难题在于,如何保证零计算专家在推理过程中,获得了合理调度。一个策略是计算预算控制,相当于美团为它的大模型,设定了一个平均消费标准;另一个策略是负载均衡控制,相当于设定了“公平派单机制”。
“零计算专家”不是一个新概念。国内团队为了尽可能地降低算力资源开销,想尽了办法。去年,昆仑万维2050研究院与天工大模型(Skywork)提出了“MOE++”,就引入三种“零计算专家”,有的直接丢弃输入,只输出零向量;有的原样照抄,复用输入;还有的则用一个可训练的常量向量来替代输入。上海交大的清源研究院也提出了类似的“空计算专家”(null experts)的概念。
第二项关键技术是“短路连接MoE”(ScMoE)。它试图解决大规模MoE推理时的通信瓶颈问题。传统上,专家并行在真正计算之前,token会被分发到分布在不同GPU上的专家,然后合并通信返回。这意味着在“通信”这个环节,GPU常常空转。在MOE层里添加短路连接(shortcut),实现计算与通信重叠,就可以让GPU在这段时间里完成另一个任务。相当于,闲着的餐馆只管自己做其他订单,不必等待上一个订单被外卖小哥取走或下一份订单需求送达才再次运营。
LongCat-Flash的预训练,用到了20万亿token规模的数据集,比早先月之暗面的Kimi-K2还大5万亿;随后进行强化推理与编码,以及扩展上下文窗口的中期训练,以及强化智能体能力的后训练。
不过,与在介绍推理性能时,明确提及部署了H800-80GB不同,在训练基础设施层面,美团使用了“数万个加速卡”(accelerators)的表述。如此“暧昧”的表述,给市场留下了不少想象空间。至少,这说明美团有足够的基础设施级别的工程能力,可以突破算力约束,留在追逐前沿模型的竞争队列里。
第二个下半场

建设大规模算力基础设施,美团不是没有这么干过。它与阿里巴巴的竞争,不仅仅关乎“外卖”,而是从云计算时代延伸至智能计算时代。10年前,云成为了美团在互联网的下半场,如今,大模型与智能体就是美团的第二次下半场。
2015年,美团云开始独立运营。王兴还曾提出过“下半场”的概念,让“互联网+”真正成为各个行业从上游到下游的产业互联网化,不是仅仅停留在最末端做营销、做交易那一小段。2017年,美团云人工智能峰会召开,宣传词就主打建立“人与人、机器之间的广泛链接”,如今再听,有点智能体的味道了。不过,美团基于云计算的尝试,在2020年开始战略性撤退。在这期间,美团已经在用AI系统优化配送调度。
大模型让美团再次闻到了“下半场”的气息。在ChatGPT问世后,无论是美团王兴,还是已经从美团退休的王慧文,都燃起了对AI的期待。大模型“即将创造出来的巨大生产力”让王兴兴奋不已,它比手机与互联网大得多。2023年2月,王慧文组建了光年之外,王兴以个人身份入局;当年6月,光年之外被美团作价20亿余元,打包收购,包括此前被光年之外收购的一流科技。
美团收购光年之外,也许是一场意外,但不突兀。清华同窗与美团旧将的王慧文因病退出,王兴出手,合乎情谊。光年之外的资产,也能补强美团内部已经启动的大模型研发。在收购前的1个月,在一季报电话会议上,王兴就表示公司多年运营,积累了大量专有数据,对AI持开放态度,内部团队也在致力于打造自研基础模型及相关应用程序。当年11月,美团大模型“通慧”获得备案审批。此外,美团还投资了大模型初创企业智谱与月之暗面,以及AI基础设施的硅基流动。
但此后,AI很少在财报电话会议上出现。市场默认美团是干外卖的,最多就是本地生活。直到2024年年报发布,王兴大声而清晰地宣布了美团“主动进攻”的AI策略,并声称过去的一年,美团的首要任务就是攒卡,保证算力供应充足。当像AI这样具有根本性革命意义的技术到来时,唯一合理的策略,就是利用你所拥有的一切去尝试进攻。
王兴还将当前美团的AI战略分为三项,包括AI at Work,提升数十万名员工的工作效率;AI in Products,改造现有产品并创建原生AI应用;以及Building LLM,即持续投入资源自研大模型。当时,王兴首次提及LongCat(龙猫),当时已在客服部门试用,效率提高了20%,客户满意度提高7.5个百分点;也介绍了它对业务拓展(BD)团队与软件技术团队的帮助。
随着LongCat的公开,美团的第二次“下半场”变得清晰起来。在美团,大模型将不仅仅是一个对话工具。它能够将美团从以往的将线下业务与线上世界连接起来的公司,转变为将数字世界和物理世界连接起来的平台。别忘了,美团还投资了机器人企业宇树科技与银河通用等等,无人机更是早在它的布局范围之内。
在LongCat的技术报告中,美团引入了两个全新的自研基准Meeseeks和VitaBench,尝试弥合传统基准和现实应用之间的鸿沟。前者模拟“用户和 AI 对话中的复杂指令”,尤其是跨轮、多条件、带上下文的请求,像极了真人与客户对话的应用场景;后者则是利用真实世界的商业场景来评估模型处理复杂现实任务的能力。
在LongCat-Flash之外,美团还藏了什么吗?也许,市场应该在一众中国开源模型中,将美团视为需要时刻关注的新玩家。
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-9-2 06:38 | 显示全部楼层
美团AI模型能赢阿里吗?
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-9-2 09:25 | 显示全部楼层
你美团就应该倒闭,现在是一块钱一公里
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-9-2 10:28 | 显示全部楼层
人人做到不点外卖就行啦……
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-9-2 10:47 | 显示全部楼层
哇哦
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-9-2 11:37 | 显示全部楼层
猫猫名如其人,取这个名字,污染了龙字,🐱猫且看下回分解,猫无毛的结局,
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-9-2 11:45 | 显示全部楼层
拿王兴敢自己在街上走吗
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-9-2 13:24 | 显示全部楼层
龙猫的混合专家架构,简短来说就是把5600 亿参数拆成多个专家小组,各管一摊,还有调度员精准派活,每次就动 270 亿参数,这种算法能省 60% 的成本。
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:410
发表于 2025-9-2 13:25 | 显示全部楼层
已经能想象到以后点外卖时的场景了,根据龙猫的算法,以后外卖能有专属美食管家,能根据自己的身体状况去下单适合自己吃的外卖😋
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:410
发表于 2025-9-2 13:25 | 显示全部楼层
龙猫这种大模型开源后,就像安卓系统那样,手机厂商不用自己做系统,专注做特色功能就行,以后外卖、打车、电商拼的就是谁能用模型把服务做贴心,这才是良性竞争。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )|网站地图

GMT+8, 2025-9-12 07:06 , Processed in 0.260707 second(s), 7 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表