再等等梁文锋

陪着寂寞看孤单 · 发表于 2026-4-20 15:01

马上注册，查看更多内容，享用更多功能，让你轻松玩转社区。

您需要登录才可以下载或查看，没有账号？注册

×

都说梁文锋变了。
在备受瞩目的DeepSeek V4发布前夕，DeepSeek首轮融资浮出水面据悉，DeepSeek正以约100亿美元估值寻求新一轮融资。然而一年前，梁文锋明确表示对商业化不感兴趣，拒绝了一批试图洽谈融资的人。
那时正逢DeepSeek初芒乍现。2025年1月，DeepSeek R1发布，彼时英伟达单日狂泻17%，市值蒸发近6000亿美元。这场极其优雅的东方开源革命，以超低成本带来顶尖模型，此后DeepSeek及梁文锋声名鹊起。
只是时过境迁，眼下大模型江湖日卷夜嚣，世界变化紧凑剧烈，DeepSeek却迟迟未拿出外界苦等的续作。
有人开始着急，有人开始怀疑，但持续封神的叙事对任何人都是一种负担。
如无意外，DeepSeek V4本周即将登场。AI圈注定不会平静。
梁文锋保持沉默
“任何事情在你怀疑并想突破它的时候，是最吸引人的阶段”，《三体》中如此写道。
这正如今天人们对DeepSeek的期待。
自2025年初以来，国内智谱、MiniMax、Kimi以及字节、阿里等在Agent和coding强化上已经更新了数版模型，春节“百模大战”一幕更是历历在目，造就覆盖文本、图像、视频多模态的AI最强春节档。
但DeepSeek仿佛不问战事。
至今，多次传闻要上线的DeepSeek V4还是没有来。有人戏言，“DeepSeek已成Next Week。”
不可否认，外界对DeepSeek的好奇、关心从来不减。最近一次DeepSeek关于模型动态的推文官宣，则停留在2025年12月初，彼时其发布了DeepSeek-V3.2和DeepSeek-V3.2-Speciale。
其实水面之下，并非没有新鲜事：今年1月，DeepSeek团队连续发布了两篇由梁文锋署名的论文，mHC（流形约束超连接）及Engram（条件记忆），瞄准对大模型长序列处理的提升。4月8日凌晨，DeepSeek悄悄上线了分层模式界面，出现快速模式和专家模式两个入口，甚至还埋下了一个视觉模式的新选项。
一切都隐隐被解读为：V4快了。
有爆料称，DeepSeek创始人梁文锋近日在内部沟通中透露，DeepSeek新一代旗舰大模型DeepSeek V4将于4月下旬正式发布。依然，DeepSeek官方没有澄清，没有回应。这风格，相当“DeepSeek”。
任江湖喧嚣鼎沸，无论是梁文锋还是DeepSeek团队，与外界的互动从来都克制。
这种克制足够深入，一位AI猎头就聊起：有认识的大厂员工跳槽去DeepSeek后就“失联”了，再也没回复过微信。投资界此前和一位DeepSeek研究员交流，聊及公司，一律保持缄默。
人们为什么期待V4
DeepSeek此前坚定不融资。
多年前，中国前首富陈天桥曾与梁文锋对谈四小时，然后梁文锋婉拒了陈天桥的投资。2024年初，联想创投也找到梁文锋想投一笔钱，但同样无果。
再后来，无论大模型江湖融资如何热闹非凡，DeepSeek融资通道始终紧闭。甚至一度有消息称：梁文锋不急于获得投资，担心外部投资者会干预DeepSeek的决策。
专注，低调，不太做没把握的事梁文锋及DeepSeek给外界留下如此印象。
依稀记得2025年初，DeepSeek R1横空出世，在纯强化学习激发推理能力这条路径上开创了先河，它向世界宣告着：中国能够以极低成本做出世界级的模型。
更优雅的是，还是开源的。
以至于2025年的精彩仿佛就是由“DeepSeek时刻”开启，这年中国大模型江湖迅速崛起和急剧变化，不仅是价格战与开源潮袭来，竞争路线也开始高度集中在AI编程和多模态。
时至今日，开源者DeepSeek依然无可避免寄托着中国人工智能的厚望，诚如今天外界对DeepSeek V4的期冀。
如无意外，本周，DeepSeek将推出新一代大模型DeepSeek V4。此时，距离上一次重大版本更新已经过去15个月。
此前有市场传闻，DeepSeek V4不仅将带来万亿参数规模和百万级上下文窗口，更首次实现与华为昇腾等国产芯片的深度适配，标志着中国AI产业在去CUDA化道路上迈出关键一步。
一个细节是，2025年DeepSeek V3发布时，就有开发者发现模型代码里出现了大量PTX（Parallel Thread Execution）指令的踪迹这是英伟达GPU的汇编语言，比CUDA更底层，当时市场就开始猜测：DeepSeek在修炼脱离CUDA的内功。
隐隐约约，梁文锋依然是那个要做出创新的人。
中国AI叙事沸腾
别催梁文锋
短短一年，中国AI叙事翻天覆地。
应用端的繁荣肉眼可见。国家数据局3月一则数据显示，中国日均Token调用量已突破140万亿，较两年前的1000亿增长超过1400倍。
这带来了全产业链的景气：Kimi、智谱、Minimax等大模型商，还有阿里、字节等各大云厂商，以及芯片层、服务器层、算力调度层的参与者，无一不在积极承接这波需求冲击。
因此，一种声音翻涌得更加厉害：DeepSeek应该趁现在来一波大的。
但天下英雄如过江之鲫，巨大机会敞口意味着更激烈的竞争。就在这个传闻V4将发布的4月，由姚顺宇统筹的混元大模型也将发布HY 3.0，内部称之为：混元系列重大版本迭代。
可以感受到，DeepSeek本身压力也在显现2026年开年来，DeepSeek上演了至少7次大规模服务中断，例如3月29日晚至当月30日上午，其网页端与APP端同时无法使用，宕机时间持续约12小时。
以及肉眼可见的人才流失。2025年底至2026年初，DeepSeek有郭达雅、魏浩然、王炳宣、阮翀、罗福莉等多名核心研发骨干离开。当这次传出DeepSeek融资，市场也不可避免想到：DeepSeek不融资就没有市场估值锚点，无法给拿了期权的核心员工吃下定心丸。
而对于令人兴奋的适配国产芯片消息，亦是一项成本极高而沉重的重写工程。外界几乎一致认为，DeepSeekV4多次跳票，就与重写底层代码试图适配国产芯片密切相关。
“我们不是有意成为一条鲶鱼，只是不小心成了一条鲶鱼。”梁文锋曾如此坦言。此时此刻，或许更不该让曾无意成为鲶鱼的DeepSeek，承担商业世界的慕强叙事。
不可否认，DeepSeek曾真真切切给中国AI带来破壁时刻。无论DeepSeek能否再给世人以震撼，它所展现的世界观和方法论，都极大支撑了对通用大模型的理解甚至对顶尖人才的理解。
不妨再给DeepSeek一些耐心。

qqwa1234 · 发表于 2026-4-20 15:26

去年我朋友公司用DeepSeek处理超长文本，效率翻倍，就像给老牛装了火箭，现在等V4适配国产芯片，感觉要起飞

诛仙九妹 · 发表于 2026-4-20 15:53

再等特朗普访华

咖啡豆 · 发表于 2026-4-20 16:07

反正我满仓拓维了

镜花水月 · 发表于 2026-4-20 16:17

支持Deepseek!

颠颠 · 发表于 2026-4-20 17:22

一个量化收割的人不值得崇拜

tdh0011 · 发表于 2026-4-20 21:07

果断MARK，前十有我必火！

liangee · 发表于 2026-4-21 09:03

感谢分享！

com2 · 发表于 2026-4-21 10:25

谢谢楼主分享！

waluheke · 发表于 2026-4-21 10:54

11111111

账号		自动登录	找回密码
密码			注册

[科技新闻] 再等等梁文锋

马上注册，查看更多内容，享用更多功能，让你轻松玩转社区。

浏览过的版块