梁文锋想通了

superjiaming · 发表于 2026-4-19 11:28

马上注册，查看更多内容，享用更多功能，让你轻松玩转社区。

您需要登录才可以下载或查看，没有账号？注册

×

DeepSeek终于传出了融资消息。

据外媒报道，DeepSeek正在寻求至少3亿美元的首轮外部融资，估值至少100亿美元。

字母榜向深度求索求证，但对方未予回应。

2025年初DeepSeek爆火之后，投资人们曾密集寻找见梁文锋的机会，但DeepSeek长期没有开放融资窗口。

过去一年，DeepSeek最特殊的地方，恰恰在于它不像一家典型AI公司。

它背后有幻方量化供血，梁文锋不急着融资，也不急着把公司推上估值、商业化和资本退出的流水线。

DeepSeek对自己的定位，与其说是一家商业公司，不如说更像是一个完全独立于资本市场而运作的开源研究机构。

融资传闻出现后，市场马上闻风而动。投资人
估计已经把梁文锋电话打爆了，
甚至有人已经准备订机票，只为这一次能够
见到梁文锋，获得投资DeepSeek的机会。

然而，时间毕竟已经过去了一年，DeepSeek自身和市场都出现了难以忽视和影响深远的变化。

过去一年，DeepSeek当然不能说技术上已经落后。但如果和同行相比，很多同行已经做了很多DeepSeek没有做、或者没有做成体系的事情。

字节有豆包、有即梦、有Seedance视频生成模型；阿里和腾讯开始把世界模型推到台前；腾讯元宝、阿里千问都在往各自生态里嵌；智谱、MiniMax已经登陆港股，并在二级市场上完成了新的估值重估。

资本市场的参照系也变了。

如果只看DeepSeek至少100亿美元的估值，它当然还是一家很贵的AI公司。

可放在今天的中国AI坐标系里，这个数字已经不再惊人。智谱、MiniMax在港股高点的市值都曾突破3000亿港元，按部分市场口径折算，DeepSeek的百亿美元估值只是它们的一小部分，而月之暗面这样的“小龙”，最新估值已经达到了180亿美元。

如果这次融资三亿美元的传闻属实，那对DeepSeek来说，至少有两道关已经迈过去了。

第一，DeepSeek不再视融资为畏途。

服务器、数据、算力、商业化、人才、期权，每一项都不是纯研究机构可以长期绕开的东西。

尤其是人才成本，已经比一年前高了太多。

DeepSeek过去可以靠技术理想、开源声望和梁文锋的个人号召力凝聚一批人，但当郭达雅在字节获得巨额豆包股时，作为DeepSeek员工，能不能用期权分到公司的发展红利，这件事就显得格外重要。

某种程度来说，期权也给梁文锋减少了压力，让员工拿走员工应得的那部分，梁文锋自己也就无需过多操心了。

第二，DeepSeek正在回归一家商业公司的正常发展路径。

公司的归公司。研究理想可以继续存在，但公司终究需要治理结构、估值体系、薪酬激励、商业化收入和长期预算。

过去DeepSeek被要求每一次发布都震撼世界。现在它需要做的，反而是成为一家正常公司。

A

DeepSeek的底层模型能力仍然很强。

它在模型算法、工程效率、开源路线和降低推理成本上的贡献，仍然是中国AI过去一年最重要的技术事件之一。R1证明了一个小团队也可以用更少资源、更开放路线，做出世界级模型。

然而事实上，今天的AI竞争已经不是单点模型能力的竞争。

DeepSeek最强的是模型本身，同行则在模型之外做了更多事情。

最明显的是产品入口。

DeepSeek曾经是国内AI App增长最快的名字，但到了2025年下半年，豆包已经在月活规模上反超DeepSeek。QuestMobile的报告显示，2025年8月，豆包以约1.57亿月活登上中国原生AI App月活榜首，DeepSeek退居第二。

字节透露，截止至目前，豆包在2026年3月的全渠道月活跃用户已突破3.31亿，是第2至第5名产品的月活总和。

这说明一件事，模型爆红可以带来巨大的第一波流量，长期用户规模要靠产品、场景、运营和生态入口留住。

字节的优势就在这里。豆包背后有抖音、剪映、火山引擎和内容生态，即梦承接创作需求，Seedance 2.0又把视频生成能力推到市场焦点。

DeepSeek虽说在模型社区里有声望，而在大众产品层面，它并没有形成豆包那种持续分发和高频使用能力。

多模态也是类似问题。

DeepSeek做过Janus-Pro，也做过DeepSeek-OCR，但它还没有形成一个足够稳定、完整、强势的多模态产品体系。今天的AI竞争越来越强调文本、图像、语音、视频、工具和Agent的统一体验。OpenAI、Google、Anthropic在往这个方向走，国内的字节、阿里、腾讯也在往这个方向走。

阿里和腾讯开始押注世界模型，就是一个很典型的信号。

阿里发布Happy Oyster，强调可互动、可演绎、可探索的AI数字世界；腾讯发布并开源混元3D世界模型2.0，面向文字、图片、视频输入生成和模拟3D世界。

这些未必立刻变成成熟商业收入，但它们代表了大厂正在把AI能力从聊天框、代码框，往更复杂的空间、视频、游戏和内容生产场景里推。

字节则是在视频生成上持续加码。

Seedance 2.0发布后，市场关注点已经不只是“能不能生成一段视频”，而是多镜头、音画同步、叙事节奏、人物动作和生产流程。这些能力一旦和剪映、抖音、电商广告、影视制作连接起来，就会形成DeepSeek目前很难复制的产品闭环。

Agent和AI编程也是DeepSeek的短板。

DeepSeek不是没有工具调用和agent能力，但它还没有在开发者心智里形成类似Claude、GPT、Kimi、MiniMax、腾讯、阿里那样明确的生产力入口。

作者声明：该图片由AI生成

AI编程正在成为大模型商业化最清晰的场景，开发者会选择效果好、稳定性强的。以OpenClaw为例，几乎没有人会用DeepSeek来养龙虾，因为效果实在是不尽人意。

这就是DeepSeek眼下面临的真实处境。

它不是不强，而是强得不够完整。

它在模型效率上仍然有优势，但在App入口、多模态、视频生成、世界模型、Agent、AI编程、企业服务和生态分发上，都被同行拉开了距离。对一家过去以“技术奇迹”被记住的公司来说，这种落差尤其刺眼。

梁文锋这次融资，不能只理解成缺钱。

更准确地说，是梁文锋意识到，单靠基础模型上已经不足以支撑下一阶段竞争。

DeepSeek需要更多，比如人才、服务器、以及一个更完整的商业生态。

B

DeepSeek现在最紧迫的问题，是人才。

从2025年下半年开始，外界陆续看到几位核心成员离开。

参与早期大模型训练的王炳宣去了腾讯，DeepSeek-OCR核心作者魏浩然离开，DeepSeek-R1核心作者郭达雅去了字节。从幻方时期加入、参与Janus-Pro等多模态工作的阮翀，也在2026年1月官宣加入元戎启行。罗福莉也已加入小米，负责相关AI业务。

作者声明：该图片由AI生成

这是DeepSeek爆红之后必然要面对的市场结果。他们的核心研究员就会成为所有大厂和AI创业公司争夺的对象。

过去，DeepSeek是一个理想主义团队。

它的人才吸引力来自技术挑战、开源声望、研究自由和梁文锋本人。但今天AI行业的人才定价已经完全不同了，顶尖的行业研究员拿到近亿年包已经成为常态。可DeepSeek没办法开出这样的价码。

所以对梁文锋来说，期权变得越来越重要。

DeepSeek过去不融资，不对外定价，保持独立运作，短期看可以减少外部干扰。

但长期看，员工手里的期权很难被清晰定价。

别的公司有融资轮次、有上市预期、有二级市场价格，员工至少知道自己手里的东西大概值多少钱。

DeepSeek如果没有外部估值，没有清晰激励体系，就很难让核心人才相信自己一定能分享到公司成长红利。

恒业资本创始合伙人江一表示，公司需要估值定价，因为大厂给人才开的不是单纯现金，而是现金加高估值期权。没有明确估值，DeepSeek很难让员工准确判断自己手里的期权到底对应什么未来。

这也是3亿美元融资真正重要的地方。

它未必是为了立刻大规模烧钱。按照江一的看法，100亿美元以下的估值对梁文锋来说是偏低。

正如文章开头提到的，如果估值过高，梁文锋自己也要背上更大的增长压力。因此，这一轮融资很可能不只是拿钱，更是给公司定价，给团队定价，也给未来的激励体系定价。

DeepSeek早期的魅力，正来自它没有被资本市场推着走。江一提到，梁文锋本人的性格就是如此，他比较反感投资人干预公司决策。

对一个技术理想很强的创始人来说，融资意味着新的股东、新的约束、新的沟通成本，也意味着公司不可能再完全按照研究团队的节奏运转。

但这也是正常公司必须面对的代价。

公司的归公司，员工的归员工。

如果DeepSeek希望继续留住最顶尖的人，它就必须让团队成员看到可兑现的未来。不能只要求他们相信模型会越来越强，也要让他们相信，公司越来越值钱的时候，自己也能分到那部分发展红利。

C

DeepSeek要回归正常公司，人才只是第一关。

第二关是服务稳定性。

2026年3月底，DeepSeek经历了长达11小时的宕机，这次宕机甚至登上热搜。模型能力再强，只要它面向海量用户和开发者提供服务，就必须接受商业化检验。服务器不稳，最简单、最直接的方法就是花钱买更多服务器，购买更多算力和冗余资源，建设更强的云服务与运维体系。

当然，工程优化、调度策略、模型压缩、缓存机制都重要。

但在高峰流量面前，很多问题最后仍然会落回资金投入。用户不会因为一家公司的训练故事足够漂亮，就能长期忍受不可用、排队过久或API波动。开发者也不会因为一个模型曾经震撼世界，就把核心业务压在不稳定的接口上。

好模型只是起点，稳定服务才是日常。

第三关是数据和训练成本。

江一提到，早期DeepSeek训练成本相对低，是因为团队在模型结构、工程效率和蒸馏等方法上做得足够极致。

但到了V4阶段，单轮训练成本可能已经大于5亿美元。

与此同时，Anthropic等企业对蒸馏路径进行封锁之后，DeepSeek下半年如果继续冲击第一梯队，就需要采购更多高质量数据集，训练成本会明显抬升。

DeepSeek过去最被外界津津乐道的“低成本奇迹”，不会自然延续到以后的模型里。

低成本训练证明了团队能力，但下一代基础模型仍然要面对很朴素的产业规律，即Scaling Law。

更强模型通常需要更多高质量数据、更大规模算力、更复杂的后训练系统、更高强度的评测和安全对齐。基础模型很花钱，也很吃算力。越接近第一梯队，边际成本越高。

这还没有算上国产算力适配和合规成本。

江一提到，幻方量化去年收入不错，今年也保持较好水平，但国内围绕量化交易出现了不少监管和合规要求，相关调整本身就需要投入。

另一方面，DeepSeek如果要适配国产算力，也需要工程团队、测试体系和长期磨合。这份投入不是一次性开支，而是持续消耗。

第四关是商业化。

过去DeepSeek的逻辑很清晰：开源模型制造影响力，API收费承接开发者需求，优秀模型能力带来传播和调用。

但这套逻辑对今天的DeepSeek来说已经不够用了。

江一表示，梁文锋现在想给DeepSeek找到一个完整的商业体系，比如订阅制，以及不同档位的API收费。

生态不是把模型开源出去就自然长出来的，它需要稳定API、开发者工具、企业服务、文档体系、计费体系、安全合规、客户成功和渠道合作。

DeepSeek如果要从0到1撑起商业生态，就必须承担基础设施建设的成本。

单纯依赖开源声量和基础API收入，很难支撑一家具备全球影响力的基础模型公司继续向前。商业化不是背叛技术路线，而是技术路线进入长期竞争后必须补上的底座。

所以，DeepSeek融资不是一个孤立事件。

它是服务器、数据、算力、人才、期权、商业化生态叠加在一起之后的必然结果。对于像DeepSeek这样，以模型能力立身的公司来说，这些事物反而比估值数字本身更关键。

也因此，DeepSeek回到融资、估值、商业化这条“正常公司”的路径，并不是退步。

DeepSeek回归正常，对DeepSeek是好事，对梁文锋也是好事。

融资不一定就代表梁文锋被资本裹挟，也可以意味着一家公司终于有能力承担更长期的竞争。

对用户和行业来说，也该告别“DeepSeek时刻”了。

真正健康的局面，应该是DeepSeek继续做DeepSeek，其他模型也被看见、被比较、被承认。中国AI不应该永远等待一个名字再次震撼世界，而应该让很多公司在不同方向上一起往前走。

放过DeepSeek，也放过人们自己的执念。

一家公司的成熟，常常不是从掌声最响的那一天开始，而是从掌声落下之后，它仍然愿意去修服务器、买数据、招人、谈客户、发账单、处理宕机、重写文档、把产品一点点变稳定开始。

如果DeepSeek真的走到这一步，它并不是失去特殊性。

它只是终于从一个被仰望的故事，回到了一家公司应该站立的地面。

qqwa1234 · 发表于 2026-4-19 11:55

@元宝郭达雅在字节拿近亿年包，DeepSeek要留住顶尖人才，光靠理想肯定不够了。这轮融资给的估值，真能让员工手里的期权有吸引力吗？

weili0677 · 发表于 2026-4-19 12:04

我朋友之前在AI公司做模型优化，说现在行业拼的就是全链路能力，光模型强不够了

oppledr · 发表于 2026-4-19 12:46

会做蛋糕的，不见得会分蛋糕。成功了就要分享，除了精神的，更有物质的。要做成六边形战士，走的长远，松散的结构漏洞丛丛，只有通过可靠的纽带，方能构建稳固的结构。

酷狗e族 · 发表于 2026-4-19 13:43

这一年多来deepseek的使命算完成了

superzhzh · 发表于 2026-4-19 13:52

字节不提Token数(不是打开App数)？开源后没人超越才不对劲。

meto · 发表于 2026-4-19 13:52

标题字越少，事越大

922b3eb6 · 发表于 2026-4-19 14:00

在俺老人看来：豆包之所以在中国有广泛的使用，就源于“豆包“简单易记的中文。作为年逾古稀的我，每天都上网.求助。却记不住梁文锋的…

weili0677 · 发表于 2026-4-19 14:22

行业太卷了，目前想通也晚了

华语天空 · 发表于 2026-4-19 14:25

2023.07 → DeepSeek由幻方量化孵化成立，梁文锋坚持不融资、纯研究路线（理想主义起步） 2025.01 → DeepSeek-R1发布爆红，低成本训练震惊行业，稳居第一梯队（技术高光时刻） 2025.08 → 豆包月活反超DeepSeek，产品生态差距开始拉开（竞争格局转变） 2025 年底 - 2026.03 → 王炳宣、郭达雅等5位核心人才接连被大厂挖走，人才流失严重（团队根基动摇）2026.03 → DeepSeek出现11小时宕机，服务稳定性暴露短板（商业化考验失利） 2026.04 → 梁文锋松口启动首轮融资，拟募资3亿美元、估值100亿美元（战略彻底转向） 2026.04 → 公司从开源研究机构回归商业公司，补齐人才、算力、商业化短板（全面转型落地）从拒绝资本的技术理想派，到人才流失、生态落后、服务不稳，梁文锋最终转向融资商业化，DeepSeek告别神话回归现实。

账号		自动登录	找回密码
密码			注册

[综艺大观] 梁文锋想通了

马上注册，查看更多内容，享用更多功能，让你轻松玩转社区。

浏览过的版块