夜间模式 切换到宽版

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 47|回复: 3

[科技新闻] 悲情DeepSeek:为国产芯片崛起,放弃速度和融资

[复制链接]
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2026-4-21 16:10 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
1.webp


  作者 | 李家
编辑 | 方堃

没人会想到,引爆全球大模型市场的DeepSeek,会在接下来的十五个月里陷入一场漫长而孤独的沉默。
接连跳票之后,DeepSeek V4终于要来。据《创智记》从知情人士处获悉,创始人梁文锋在内部沟通中表示 V4将在4月下旬发布。这款承载着万亿参数规模、百万级上下文窗口的新模型,被寄予厚望,但也被重重疑虑包裹,V4究竟还能不能打?
近日,外媒传出DeepSeek正以100亿美金估值融资3亿美金,更令很多人惋惜。昨日的大模型王者似乎泯然众人矣,曾坚持独立路线的梁文锋最终也扛不住资本竞赛压力。
这是一个残酷的现实:过去一年,DeepSeek失去了宝贵的研发时间、人才、融资最佳节点,以及在全球大模型竞赛中的优势。
但很多人却没意识到,这一年时间,DeepSeek究竟付出了什么?
答案是,这一切的代价,很大程度上源于一个被外界低估的选择——为深度适配国产芯片,梁文锋走上一条更艰难的路。
一位投资人告诉《创智记》,并非梁文锋不愿更早开启融资,而是因为DeepSeek要走的这条路,显然不是对资本利益方的最优解,一旦融资,公司战略必受影响。
2025年,DeepSeek证明了一件事:中国实验室可以用极低成本,做出接近美国前沿水平的大模型。这个成就让DeepSeek从一家技术公司,变成了象征——中国AI打破美国技术封锁的第一个成功样本。
而这种象征意义,意味着DeepSeek不再能只做"纯粹的技术选择"。
当国产芯片需要一次顶级大模型的"认证",当政策导向需要一家标杆企业"带头示范",DeepSeek被推到了那个时代的位置上——梁文锋可以选择拒绝,代价可能是更复杂的外部环境;他也可以选择接受,代价就是牺牲迭代速度、牺牲融资节奏、牺牲团队稳定。
梁文锋选择了后者。


01
 “去CUDA化”的代价


在全球大模型行业,十五个月足以跨越一个技术的代际。
2025年初R1爆红之后,OpenAI连推GPT-4.5、GPT-5和多个推理模型变体;Anthropic的Claude系列迭代了三代;国内战场上,字节豆包月活冲至3.31亿,阿里通义千问持续进化,智谱和MiniMax双双登陆港交所,市值突破500亿美元。同量级玩家月之暗面,估值也从40亿美元涨到了180亿美元。
而DeepSeek,从2025年1月到2026年4月,整整十五个月没有发布大模型新版本。这期间不是没有动静,但这些零散的更新,远不足以填补十五个月的空白。
原计划2026年春节前后亮相的V4,为何一拖再拖?据多方信源,核心原因指向一个沉重但很少被公开讨论的因素:国产算力深度适配。
这不是简单的技术优化,而是一次从底层架构开始的"换骨"。
DeepSeek的模型长期运行在英伟达GPU生态上,CUDA的成熟度、工具链的完备性、工程师的熟悉度,都是短期内无法被替代的优势。但2025年1月,外媒披露了一个细节:R1发布后,有关部门鼓励DeepSeek采用华为昇腾处理器。2月,梁文锋出席民营企业座谈会,与任正非、马化腾等大佬坐在第一排。
政策导向的齿轮开始转动,DeepSeek从一家技术公司,被推向了国家自主可控战略的关键位置。
据了解,2025年初,DeepSeek尝试过用华为昇腾910C进行训练,但过程坎坷:训练稳定性不足,大规模分布式场景崩溃,芯片间通信速度未达预期。但适配没有停止,V4研发期间,DeepSeek做了一个极具象征意义的决定:没有提前给英伟达开放测试权限,反而优先将预发布版本交给华为新一代昇腾950PR芯片做适配,并同步适配寒武纪等国产芯片。
这是一次"反常识"的选择。全球主流大模型厂商的首发逻辑,无一例外是优先适配英伟达——生态成熟、性能最强、市场认可度最高。DeepSeek反其道而行,意味着要将大量技术资源投入到底层代码迁移、精度对齐、框架重构上,从CUDA全面转向国产生态。
难度有多大?据接近项目的人士透露,核心挑战在于精度对齐——确保模型在不同硬件生态下输出一致,这涉及海量底层代码调整。当全球厂商保持2-3个月的迭代节奏时,DeepSeek的技术团队却在为"国产替代"打地基。这十五个月的延迟中,相当大比例的技术资源投入了国产芯片适配。
更微妙的是战略信号。据公开报道,阿里、字节、腾讯等头部云厂商已向华为下单数十万颗昇腾950PR芯片。它们在等待DeepSeek V4的验证结果——如果V4能在昇腾上跑通万亿参数训练与推理,意味着国产芯片终于具备支撑顶级大模型的能力;相当于为行业探明了当下国产算力的能力边界。
英伟达CEO‌黄仁勋在最新访谈中警告,如果DeepSeek优先适配华为平台,对美国来说将是“灾难性的”坏消息‌。他真正介意的不是中国做出优秀的大模型,而是‌全球顶级开源模型不再以英伟达的CUDA生态为默认优化起点‌。


02
 “不得不”融资
2.png




DeepSeek V4,成了国产芯片的试金石,但梁文锋必须自己来承担试错的成本。
就在V4即将发布的节点上,另一条重磅消息传来:DeepSeek正洽谈首次外部融资,估值超100亿美元,募资至少3亿美元。
从时间节点上看,梁文锋已完成自己的使命,DeepSeek V4深度适配国产芯片;而从市场商业角度来看,DeepSeek已到了不得不融资的生死攸关时刻。
梁文锋曾是中国AI圈"最难搞"的创始人,他的姿态很明确:DeepSeek不缺钱,不稀释股权,不被商业化时间表绑架。
底气来自母公司幻方量化。2025年年收入预计50亿元人民币左右。这些钱,直接以研发预算形式流入DeepSeek,没有外部股东、没有LP、没有退出压力。
但幻方的利润终究有其边界。V4是万亿参数级模型,算力、技术研发投入,加上Agent、多模态方向的并行投入,以及国产芯片适配带来的额外工程开销,幻方每年50亿的收入,放在大厂千亿级别的AI资本开支面前,显得捉襟见肘。
更致命的是人才流失。
2026年4月,前DeepSeek研究员郭达雅——GRPO算法的主要贡献者,R1推理能力训练方法论的核心人物——加盟字节Seed团队。此前,核心成员罗福莉也被小米挖角。挖角的武器不是情怀,而是确定的财富预期:字节有豆包股,小米有上市期权,智谱和MiniMax的员工股票已在港股市场流通。而DeepSeek的员工期权,长期缺乏市场化估值锚点,无法兑现。
仅靠技术理想和个人声望,留不住顶级研发人才。融资,成了给团队一个"可兑现的未来"的必由之路。
但此时融资,时机也堪称尴尬。V4尚未发布,市场信心未知,100亿美元的估值,在2026年的AI坐标系里明显偏低——智谱和MiniMax市值已破500亿美元,月之暗面180亿美元,胡润榜单更将DeepSeek标为1450亿美元。
十五个月的空白期里,竞争对手没有睡觉。OpenAI和Anthropic的估值已分别达到8520亿和3800亿美元,资本储备不在一个量级。V4即便技术出色,也可能只是"追平差距",而非"再次颠覆"。

结语

多位与DeepSeek深入合作的AI创业者向《创智记》表示,"业界不应抱太高期待,V4很难再复制去年DeepSeek-V3的影响力"。
但如果把DeepSeek的牺牲放在更大的语境下看,它的"悲情"具有某种结构性必然。
如果V4成功在华为昇腾上跑通万亿参数训练与推理,将意味着国产AI芯片首次具备支撑世界顶级大模型的全链路能力。这不仅会提振华为昇腾的商业前景,也会为整个国产算力生态注入强心针——从寒武纪到摩尔线程、沐曦,国产芯片厂商都在等待这样一个"被证明"的时刻。
从这个角度看,DeepSeek的十五个月沉默,是一次技术理想主义与国家产业战略的艰难握手。它牺牲了全球竞赛中的先发优势,牺牲了最佳融资窗口,牺牲了部分核心人才,换来的可能是一条路——一条中国AI产业摆脱CUDA依赖、走向算力自主的路。
这种选择值不值得,历史会给出答案。V4的迟到,不只是一个产品的延迟,而是在一场关于技术、资本与国家命运的复杂博弈中,一家创业公司所付出的代价。
  • 打卡等级:炉火纯青
  • 打卡总天数:76
发表于 2026-4-21 18:09 | 显示全部楼层
牛X,支持...
回复 支持 反对

使用道具 举报

  • 打卡等级:功行圆满
  • 打卡总天数:751
发表于 2026-4-21 18:25 | 显示全部楼层
感谢分享
回复 支持 反对

使用道具 举报

  • 打卡等级:功行圆满
  • 打卡总天数:758
发表于 2026-4-21 21:02 | 显示全部楼层
支持,非常给力!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )|网站地图

GMT+8, 2026-4-21 21:29 , Processed in 0.402604 second(s), 5 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表