夜间模式 切换到宽版

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 67|回复: 6

[科技新闻] 再等等梁文锋

[复制链接]
  • 打卡等级:已臻大成
  • 打卡总天数:410
发表于 2026-4-20 15:01 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
都说梁文锋变了。
在备受瞩目的DeepSeek V4发布前夕,DeepSeek首轮融资浮出水面据悉,DeepSeek正以约100亿美元估值寻求新一轮融资。然而一年前,梁文锋明确表示对商业化不感兴趣,拒绝了一批试图洽谈融资的人。
那时正逢DeepSeek初芒乍现。2025年1月,DeepSeek R1发布,彼时英伟达单日狂泻17%,市值蒸发近6000亿美元。这场极其优雅的东方开源革命,以超低成本带来顶尖模型,此后DeepSeek及梁文锋声名鹊起。
只是时过境迁,眼下大模型江湖日卷夜嚣,世界变化紧凑剧烈,DeepSeek却迟迟未拿出外界苦等的续作。
有人开始着急,有人开始怀疑,但持续封神的叙事对任何人都是一种负担。
如无意外,DeepSeek V4本周即将登场。AI圈注定不会平静。
梁文锋保持沉默
“任何事情在你怀疑并想突破它的时候,是最吸引人的阶段”,《三体》中如此写道。
这正如今天人们对DeepSeek的期待。
自2025年初以来,国内智谱、MiniMax、Kimi以及字节、阿里等在Agent和coding强化上已经更新了数版模型,春节“百模大战”一幕更是历历在目,造就覆盖文本、图像、视频多模态的AI最强春节档。
但DeepSeek仿佛不问战事。
至今,多次传闻要上线的DeepSeek V4还是没有来。有人戏言,“DeepSeek已成Next Week。”
不可否认,外界对DeepSeek的好奇、关心从来不减。最近一次DeepSeek关于模型动态的推文官宣,则停留在2025年12月初,彼时其发布了DeepSeek-V3.2和DeepSeek-V3.2-Speciale。
其实水面之下,并非没有新鲜事:今年1月,DeepSeek团队连续发布了两篇由梁文锋署名的论文,mHC(流形约束超连接)及Engram(条件记忆),瞄准对大模型长序列处理的提升。4月8日凌晨,DeepSeek悄悄上线了分层模式界面,出现快速模式和专家模式两个入口,甚至还埋下了一个视觉模式的新选项。
一切都隐隐被解读为:V4快了。
有爆料称,DeepSeek创始人梁文锋近日在内部沟通中透露,DeepSeek新一代旗舰大模型DeepSeek V4将于4月下旬正式发布。依然,DeepSeek官方没有澄清,没有回应。这风格,相当“DeepSeek”。
任江湖喧嚣鼎沸,无论是梁文锋还是DeepSeek团队,与外界的互动从来都克制。
这种克制足够深入,一位AI猎头就聊起:有认识的大厂员工跳槽去DeepSeek后就“失联”了,再也没回复过微信。投资界此前和一位DeepSeek研究员交流,聊及公司,一律保持缄默。
人们为什么期待V4
DeepSeek此前坚定不融资。
多年前,中国前首富陈天桥曾与梁文锋对谈四小时,然后梁文锋婉拒了陈天桥的投资。2024年初,联想创投也找到梁文锋想投一笔钱,但同样无果。
再后来,无论大模型江湖融资如何热闹非凡,DeepSeek融资通道始终紧闭。甚至一度有消息称:梁文锋不急于获得投资,担心外部投资者会干预DeepSeek的决策。
专注,低调,不太做没把握的事梁文锋及DeepSeek给外界留下如此印象。
依稀记得2025年初,DeepSeek R1横空出世,在纯强化学习激发推理能力这条路径上开创了先河,它向世界宣告着:中国能够以极低成本做出世界级的模型。
更优雅的是,还是开源的。
以至于2025年的精彩仿佛就是由“DeepSeek时刻”开启,这年中国大模型江湖迅速崛起和急剧变化,不仅是价格战与开源潮袭来,竞争路线也开始高度集中在AI编程和多模态。
时至今日,开源者DeepSeek依然无可避免寄托着中国人工智能的厚望,诚如今天外界对DeepSeek V4的期冀。
如无意外,本周,DeepSeek将推出新一代大模型DeepSeek V4。此时,距离上一次重大版本更新已经过去15个月。
此前有市场传闻,DeepSeek V4不仅将带来万亿参数规模和百万级上下文窗口,更首次实现与华为昇腾等国产芯片的深度适配,标志着中国AI产业在去CUDA化道路上迈出关键一步。
一个细节是,2025年DeepSeek V3发布时,就有开发者发现模型代码里出现了大量PTX(Parallel Thread Execution)指令的踪迹这是英伟达GPU的汇编语言,比CUDA更底层,当时市场就开始猜测:DeepSeek在修炼脱离CUDA的内功。
隐隐约约,梁文锋依然是那个要做出创新的人。
中国AI叙事沸腾
别催梁文锋
短短一年,中国AI叙事翻天覆地。
应用端的繁荣肉眼可见。国家数据局3月一则数据显示,中国日均Token调用量已突破140万亿,较两年前的1000亿增长超过1400倍。
这带来了全产业链的景气:Kimi、智谱、Minimax等大模型商,还有阿里、字节等各大云厂商,以及芯片层、服务器层、算力调度层的参与者,无一不在积极承接这波需求冲击。
因此,一种声音翻涌得更加厉害:DeepSeek应该趁现在来一波大的。
但天下英雄如过江之鲫,巨大机会敞口意味着更激烈的竞争。就在这个传闻V4将发布的4月,由姚顺宇统筹的混元大模型也将发布HY 3.0,内部称之为:混元系列重大版本迭代。
可以感受到,DeepSeek本身压力也在显现2026年开年来,DeepSeek上演了至少7次大规模服务中断,例如3月29日晚至当月30日上午,其网页端与APP端同时无法使用,宕机时间持续约12小时。
以及肉眼可见的人才流失。2025年底至2026年初,DeepSeek有郭达雅、魏浩然、王炳宣、阮翀、罗福莉等多名核心研发骨干离开。当这次传出DeepSeek融资,市场也不可避免想到:DeepSeek不融资就没有市场估值锚点,无法给拿了期权的核心员工吃下定心丸。
而对于令人兴奋的适配国产芯片消息,亦是一项成本极高而沉重的重写工程。外界几乎一致认为,DeepSeekV4多次跳票,就与重写底层代码试图适配国产芯片密切相关。
“我们不是有意成为一条鲶鱼,只是不小心成了一条鲶鱼。”梁文锋曾如此坦言。此时此刻,或许更不该让曾无意成为鲶鱼的DeepSeek,承担商业世界的慕强叙事。
不可否认,DeepSeek曾真真切切给中国AI带来破壁时刻。无论DeepSeek能否再给世人以震撼,它所展现的世界观和方法论,都极大支撑了对通用大模型的理解甚至对顶尖人才的理解。
不妨再给DeepSeek一些耐心。
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2026-4-20 15:26 | 显示全部楼层
去年我朋友公司用DeepSeek处理超长文本,效率翻倍,就像给老牛装了火箭,现在等V4适配国产芯片,感觉要起飞
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2026-4-20 15:53 | 显示全部楼层
再等特朗普访华
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2026-4-20 16:07 | 显示全部楼层
反正我满仓拓维了
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2026-4-20 16:17 | 显示全部楼层
支持Deepseek!
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2026-4-20 17:22 | 显示全部楼层
一个量化收割的人不值得崇拜
回复 支持 反对

使用道具 举报

  • 打卡等级:炉火纯青
  • 打卡总天数:75
发表于 2026-4-20 21:07 | 显示全部楼层
果断MARK,前十有我必火!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )|网站地图

GMT+8, 2026-4-20 22:42 , Processed in 0.182758 second(s), 4 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表