夜间模式 切换到宽版

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 55|回复: 16

[综艺大观] 梁文锋想通了

[复制链接]
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2026-4-19 11:28 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
1.webp


DeepSeek终于传出了融资消息。

据外媒报道,DeepSeek正在寻求至少3亿美元的首轮外部融资,估值至少100亿美元。
2.webp


字母榜向深度求索求证,但对方未予回应。

2025年初DeepSeek爆火之后,投资人们曾密集寻找见梁文锋的机会,但DeepSeek长期没有开放融资窗口。

过去一年,DeepSeek最特殊的地方,恰恰在于它不像一家典型AI公司。

它背后有幻方量化供血,梁文锋不急着融资,也不急着把公司推上估值、商业化和资本退出的流水线。

DeepSeek对自己的定位,与其说是一家商业公司,不如说更像是一个完全独立于资本市场而运作的开源研究机构。

融资传闻出现后,市场马上闻风而动。投资人
估计已经把梁文锋电话打爆了,
甚至有人已经准备订机票,只为这一次能够
见到梁文锋,获得投资DeepSeek的机会。

然而,时间毕竟已经过去了一年,DeepSeek自身和市场都出现了难以忽视和影响深远的变化。

过去一年,DeepSeek当然不能说技术上已经落后。但如果和同行相比,很多同行已经做了很多DeepSeek没有做、或者没有做成体系的事情。

字节有豆包、有即梦、有Seedance视频生成模型;阿里和腾讯开始把世界模型推到台前;腾讯元宝、阿里千问都在往各自生态里嵌;智谱、MiniMax已经登陆港股,并在二级市场上完成了新的估值重估。

资本市场的参照系也变了。

如果只看DeepSeek至少100亿美元的估值,它当然还是一家很贵的AI公司。

可放在今天的中国AI坐标系里,这个数字已经不再惊人。智谱、MiniMax在港股高点的市值都曾突破3000亿港元,按部分市场口径折算,DeepSeek的百亿美元估值只是它们的一小部分,而月之暗面这样的“小龙”,最新估值已经达到了180亿美元。

如果这次融资三亿美元的传闻属实,那对DeepSeek来说,至少有两道关已经迈过去了。

第一,DeepSeek不再视融资为畏途。

服务器、数据、算力、商业化、人才、期权,每一项都不是纯研究机构可以长期绕开的东西。

尤其是人才成本,已经比一年前高了太多。

DeepSeek过去可以靠技术理想、开源声望和梁文锋的个人号召力凝聚一批人,但当郭达雅在字节获得巨额豆包股时,作为DeepSeek员工,能不能用期权分到公司的发展红利,这件事就显得格外重要。

某种程度来说,期权也给梁文锋减少了压力,让员工拿走员工应得的那部分,梁文锋自己也就无需过多操心了。

第二,DeepSeek正在回归一家商业公司的正常发展路径。

公司的归公司。研究理想可以继续存在,但公司终究需要治理结构、估值体系、薪酬激励、商业化收入和长期预算。

过去DeepSeek被要求每一次发布都震撼世界。现在它需要做的,反而是成为一家正常公司。

A


DeepSeek的底层模型能力仍然很强。

它在模型算法、工程效率、开源路线和降低推理成本上的贡献,仍然是中国AI过去一年最重要的技术事件之一。R1证明了一个小团队也可以用更少资源、更开放路线,做出世界级模型。

然而事实上,今天的AI竞争已经不是单点模型能力的竞争。

DeepSeek最强的是模型本身,同行则在模型之外做了更多事情。

最明显的是产品入口。

DeepSeek曾经是国内AI App增长最快的名字,但到了2025年下半年,豆包已经在月活规模上反超DeepSeek。QuestMobile的报告显示,2025年8月,豆包以约1.57亿月活登上中国原生AI App月活榜首,DeepSeek退居第二。

字节透露,截止至目前,豆包在2026年3月的全渠道月活跃用户已突破3.31亿,是第2至第5名产品的月活总和。

这说明一件事,模型爆红可以带来巨大的第一波流量,长期用户规模要靠产品、场景、运营和生态入口留住。

字节的优势就在这里。豆包背后有抖音、剪映、火山引擎和内容生态,即梦承接创作需求,Seedance 2.0又把视频生成能力推到市场焦点。

DeepSeek虽说在模型社区里有声望,而在大众产品层面,它并没有形成豆包那种持续分发和高频使用能力。

多模态也是类似问题。

DeepSeek做过Janus-Pro,也做过DeepSeek-OCR,但它还没有形成一个足够稳定、完整、强势的多模态产品体系。今天的AI竞争越来越强调文本、图像、语音、视频、工具和Agent的统一体验。OpenAI、Google、Anthropic在往这个方向走,国内的字节、阿里、腾讯也在往这个方向走。

阿里和腾讯开始押注世界模型,就是一个很典型的信号。

阿里发布Happy Oyster,强调可互动、可演绎、可探索的AI数字世界;腾讯发布并开源混元3D世界模型2.0,面向文字、图片、视频输入生成和模拟3D世界。

这些未必立刻变成成熟商业收入,但它们代表了大厂正在把AI能力从聊天框、代码框,往更复杂的空间、视频、游戏和内容生产场景里推。

字节则是在视频生成上持续加码。

Seedance 2.0发布后,市场关注点已经不只是“能不能生成一段视频”,而是多镜头、音画同步、叙事节奏、人物动作和生产流程。这些能力一旦和剪映、抖音、电商广告、影视制作连接起来,就会形成DeepSeek目前很难复制的产品闭环。

Agent和AI编程也是DeepSeek的短板。

DeepSeek不是没有工具调用和agent能力,但它还没有在开发者心智里形成类似Claude、GPT、Kimi、MiniMax、腾讯、阿里那样明确的生产力入口。
 作者声明:该图片由AI生成
3.webp


AI编程正在成为大模型商业化最清晰的场景,开发者会选择效果好、稳定性强的。以OpenClaw为例,几乎没有人会用DeepSeek来养龙虾,因为效果实在是不尽人意。

这就是DeepSeek眼下面临的真实处境。

它不是不强,而是强得不够完整。

它在模型效率上仍然有优势,但在App入口、多模态、视频生成、世界模型、Agent、AI编程、企业服务和生态分发上,都被同行拉开了距离。对一家过去以“技术奇迹”被记住的公司来说,这种落差尤其刺眼。

梁文锋这次融资,不能只理解成缺钱。

更准确地说,是梁文锋意识到,单靠基础模型上已经不足以支撑下一阶段竞争。

DeepSeek需要更多,比如人才、服务器、以及一个更完整的商业生态。

B


DeepSeek现在最紧迫的问题,是人才。

从2025年下半年开始,外界陆续看到几位核心成员离开。

参与早期大模型训练的王炳宣去了腾讯,DeepSeek-OCR核心作者魏浩然离开,DeepSeek-R1核心作者郭达雅去了字节。从幻方时期加入、参与Janus-Pro等多模态工作的阮翀,也在2026年1月官宣加入元戎启行。罗福莉也已加入小米,负责相关AI业务。
 作者声明:该图片由AI生成
4.webp


这是DeepSeek爆红之后必然要面对的市场结果。他们的核心研究员就会成为所有大厂和AI创业公司争夺的对象。

过去,DeepSeek是一个理想主义团队。

它的人才吸引力来自技术挑战、开源声望、研究自由和梁文锋本人。但今天AI行业的人才定价已经完全不同了,顶尖的行业研究员拿到近亿年包已经成为常态。可DeepSeek没办法开出这样的价码。

所以对梁文锋来说,期权变得越来越重要。

DeepSeek过去不融资,不对外定价,保持独立运作,短期看可以减少外部干扰。

但长期看,员工手里的期权很难被清晰定价。

别的公司有融资轮次、有上市预期、有二级市场价格,员工至少知道自己手里的东西大概值多少钱。

DeepSeek如果没有外部估值,没有清晰激励体系,就很难让核心人才相信自己一定能分享到公司成长红利。

恒业资本创始合伙人江一表示,公司需要估值定价,因为大厂给人才开的不是单纯现金,而是现金加高估值期权。没有明确估值,DeepSeek很难让员工准确判断自己手里的期权到底对应什么未来。

这也是3亿美元融资真正重要的地方。

它未必是为了立刻大规模烧钱。按照江一的看法,100亿美元以下的估值对梁文锋来说是偏低。

正如文章开头提到的,如果估值过高,梁文锋自己也要背上更大的增长压力。因此,这一轮融资很可能不只是拿钱,更是给公司定价,给团队定价,也给未来的激励体系定价。

DeepSeek早期的魅力,正来自它没有被资本市场推着走。江一提到,梁文锋本人的性格就是如此,他比较反感投资人干预公司决策。

对一个技术理想很强的创始人来说,融资意味着新的股东、新的约束、新的沟通成本,也意味着公司不可能再完全按照研究团队的节奏运转。

但这也是正常公司必须面对的代价。

公司的归公司,员工的归员工。

如果DeepSeek希望继续留住最顶尖的人,它就必须让团队成员看到可兑现的未来。不能只要求他们相信模型会越来越强,也要让他们相信,公司越来越值钱的时候,自己也能分到那部分发展红利。

C


DeepSeek要回归正常公司,人才只是第一关。

第二关是服务稳定性。

2026年3月底,DeepSeek经历了长达11小时的宕机,这次宕机甚至登上热搜。模型能力再强,只要它面向海量用户和开发者提供服务,就必须接受商业化检验。服务器不稳,最简单、最直接的方法就是花钱买更多服务器,购买更多算力和冗余资源,建设更强的云服务与运维体系。

当然,工程优化、调度策略、模型压缩、缓存机制都重要。

但在高峰流量面前,很多问题最后仍然会落回资金投入。用户不会因为一家公司的训练故事足够漂亮,就能长期忍受不可用、排队过久或API波动。开发者也不会因为一个模型曾经震撼世界,就把核心业务压在不稳定的接口上。

好模型只是起点,稳定服务才是日常。

第三关是数据和训练成本。

江一提到,早期DeepSeek训练成本相对低,是因为团队在模型结构、工程效率和蒸馏等方法上做得足够极致。

但到了V4阶段,单轮训练成本可能已经大于5亿美元。

与此同时,Anthropic等企业对蒸馏路径进行封锁之后,DeepSeek下半年如果继续冲击第一梯队,就需要采购更多高质量数据集,训练成本会明显抬升。

DeepSeek过去最被外界津津乐道的“低成本奇迹”,不会自然延续到以后的模型里。

低成本训练证明了团队能力,但下一代基础模型仍然要面对很朴素的产业规律,即Scaling Law。

更强模型通常需要更多高质量数据、更大规模算力、更复杂的后训练系统、更高强度的评测和安全对齐。基础模型很花钱,也很吃算力。越接近第一梯队,边际成本越高。

这还没有算上国产算力适配和合规成本。

江一提到,幻方量化去年收入不错,今年也保持较好水平,但国内围绕量化交易出现了不少监管和合规要求,相关调整本身就需要投入。

另一方面,DeepSeek如果要适配国产算力,也需要工程团队、测试体系和长期磨合。这份投入不是一次性开支,而是持续消耗。

第四关是商业化。

过去DeepSeek的逻辑很清晰:开源模型制造影响力,API收费承接开发者需求,优秀模型能力带来传播和调用。

但这套逻辑对今天的DeepSeek来说已经不够用了。

江一表示,梁文锋现在想给DeepSeek找到一个完整的商业体系,比如订阅制,以及不同档位的API收费。

生态不是把模型开源出去就自然长出来的,它需要稳定API、开发者工具、企业服务、文档体系、计费体系、安全合规、客户成功和渠道合作。

DeepSeek如果要从0到1撑起商业生态,就必须承担基础设施建设的成本。

单纯依赖开源声量和基础API收入,很难支撑一家具备全球影响力的基础模型公司继续向前。商业化不是背叛技术路线,而是技术路线进入长期竞争后必须补上的底座。

所以,DeepSeek融资不是一个孤立事件。
5.webp


它是服务器、数据、算力、人才、期权、商业化生态叠加在一起之后的必然结果。对于像DeepSeek这样,以模型能力立身的公司来说,这些事物反而比估值数字本身更关键。

也因此,DeepSeek回到融资、估值、商业化这条“正常公司”的路径,并不是退步。

DeepSeek回归正常,对DeepSeek是好事,对梁文锋也是好事。

融资不一定就代表梁文锋被资本裹挟,也可以意味着一家公司终于有能力承担更长期的竞争。

对用户和行业来说,也该告别“DeepSeek时刻”了。

真正健康的局面,应该是DeepSeek继续做DeepSeek,其他模型也被看见、被比较、被承认。中国AI不应该永远等待一个名字再次震撼世界,而应该让很多公司在不同方向上一起往前走。

放过DeepSeek,也放过人们自己的执念。

一家公司的成熟,常常不是从掌声最响的那一天开始,而是从掌声落下之后,它仍然愿意去修服务器、买数据、招人、谈客户、发账单、处理宕机、重写文档、把产品一点点变稳定开始。

如果DeepSeek真的走到这一步,它并不是失去特殊性。

它只是终于从一个被仰望的故事,回到了一家公司应该站立的地面。
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2026-4-19 11:55 | 显示全部楼层
@元宝 郭达雅在字节拿近亿年包,DeepSeek要留住顶尖人才,光靠理想肯定不够了。这轮融资给的估值,真能让员工手里的期权有吸引力吗?
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2026-4-19 12:04 | 显示全部楼层
我朋友之前在AI公司做模型优化,说现在行业拼的就是全链路能力,光模型强不够了
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2026-4-19 12:46 | 显示全部楼层
会做蛋糕的,不见得会分蛋糕。成功了就要分享,除了精神的,更有物质的。要做成六边形战士,走的长远,松散的结构漏洞丛丛,只有通过可靠的纽带,方能构建稳固的结构。
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2026-4-19 13:43 | 显示全部楼层
这一年多来deepseek的使命算完成了
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2026-4-19 13:52 | 显示全部楼层
字节不提Token数(不是打开App数)?开源后没人超越才不对劲。
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2026-4-19 13:52 | 显示全部楼层
标题字越少,事越大
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2026-4-19 14:00 | 显示全部楼层
在俺老人看来:豆包之所以在中国有广泛的使用,就源于“豆包“简单易记的中文。作为年逾古稀的我,每天都上网.求助。却记不住梁文锋的…
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2026-4-19 14:22 | 显示全部楼层
行业太卷了,目前想通也晚了
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2026-4-19 14:25 | 显示全部楼层
2023.07 → DeepSeek由幻方量化孵化成立,梁文锋坚持不融资、纯研究路线(理想主义起步) 2025.01 → DeepSeek-R1发布爆红,低成本训练震惊行业,稳居第一梯队(技术高光时刻) 2025.08 → 豆包月活反超DeepSeek,产品生态差距开始拉开(竞争格局转变) 2025 年底 - 2026.03 → 王炳宣、郭达雅等5位核心人才接连被大厂挖走,人才流失严重(团队根基动摇)2026.03 → DeepSeek出现11小时宕机,服务稳定性暴露短板(商业化考验失利) 2026.04 → 梁文锋松口启动首轮融资,拟募资3亿美元、估值100亿美元(战略彻底转向) 2026.04 → 公司从开源研究机构回归商业公司,补齐人才、算力、商业化短板(全面转型落地) 从拒绝资本的技术理想派,到人才流失、生态落后、服务不稳,梁文锋最终转向融资商业化,DeepSeek告别神话回归现实。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )|网站地图

GMT+8, 2026-4-20 02:33 , Processed in 0.675049 second(s), 5 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表