精睿.网络安全_杀毒软件推荐|ESET|NOD32|激活|vc52|安软联盟|梦想论坛

77898876 发表于 2026-2-11 10:42

春节见？DeepSeek下一代模型：助力中国突破“算力芯片和内存”瓶颈

本文作者：鲍奕龙
来源：硬AI
野村证券指出，DeepSeek即将发布的新一代大模型V4，预计不会像去年的V3一般引发全球AI算力需求的恐慌。但它可能通过两项底层架构创新，加速全球大语言AI应用的商业化进程。
华尔街见闻提及，据报道DeepSeek新一代旗舰模型V4预计将于2026年2月中旬面世。内部初步测试表明，V4在编程能力上超过了目前市场上的其他顶级模型，如Anthropic的Claude和OpenAI的GPT系列。
一个核心问题再次浮现：V4会再次颠覆全球AI价值链吗？野村证券在2月10日发布的《全球AI趋势追踪》报告中给出了明确的判断：不会。
研报指出，这次发布的意义在于V4可能通过创新架构（mHC和Engram技术）进一步降低训练和推理成本，加速中国AI价值链创新周期。
同时有望帮助全球大语言模型和AI应用企业加速商业化进程，从而缓解日益沉重的资本开支压力。
创新技术架构带来性能与成本优化

报告指出，算力芯片和内存一直是中国大模型的瓶颈。而V4有望引入的两项关键技术——mHC和Engram，从算法和工程层面针对这些硬约束优化。
mHC：

[*]全称为“流形约束超连接”。它旨在解决Transformer模型在层数极深时，信息流动的瓶颈和训练不稳定的问题。
[*]简单说，它让神经网络层之间的“对话”更丰富、更灵活，同时通过严苛的数学“护栏”防止信息被放大或破坏。实验证明，采用mHC的模型在数学推理等任务上表现更优。

（超连接与流形约束超连接）
Engram：

[*]一个“条件记忆”模块。它的设计理念是将“记忆”与“计算”解耦。
[*]模型中的静态知识（如实体、固定表达）被专门存储在一个稀疏的内存表中，这个表可以放在廉价的DRAM里。当需要推理时，再去快速查找。这释放了昂贵的GPU内存（HBM），让其专注于动态计算。

（Engram架构）
研报指出这两项技术的结合对中国AI发展意义重大。用更稳定的训练流程（mHC）弥补国产芯片可能存在的不足；用更聪明的内存调度（Engram）绕过HBM容量和带宽的限制。
野村强调V4最直接的商业影响就是进一步降低大模型的训练与推理成本，这种成本效益的提升将刺激需求，届时中国AI硬件公司将受益于加速的投资周期。
硬件受益于“加速周期”

野村认为全球主要云服务商正全力追逐通用人工智能，资本开支的竞赛远未停歇。因此V4预计不会对全球AI基础设施市场造成去年那种级别的冲击波。
不过全球大模型及应用开发商正背负着日益沉重的资本开支负担。V4若能如预期般，在维持高性能的同时显著降低训练与推理成本，将成为一剂强心针。
它可能帮助这些玩家更快地将技术转化为收入，缓解盈利压力。
报告回顾了DeepSeek-V3/R1发布一年后的市场格局。
此前DeepSeek的两个模型V3和R1的“算力管理效率”叠加“性能提升”加速了中国LLM与应用发展，也改变了全球与中国大语言模型竞争格局，并推动开源模型更受关注。

（OpenRouter上排名前15的开源模型每周Token消耗量）
在2024年底，DeepSeek的两个模型曾占据OpenRouter上开源模型Token使用量的一半以上。但到了2025年下半年，随着更多玩家加入，其市场份额已显著下降。
市场从“一家独大”走向了“群雄割据”。这表明，仅凭单一模型的高效，已不足以统治快速演进的开源生态，如今V4面临的竞争环境，远比一年前复杂。
软件或迎来“增值而非被替代”

在应用侧，更强大、更高效的V4将催生更强大的AI智能体。
报告观察到，像阿里通义千问App等，已经能够以更自动化的方式执行多步骤任务。这意味着，AI智能体正从“对话工具”转型为能处理复杂任务的“AI助手”。
这些能执行多任务的智能体，需要更频繁地与底层大模型交互，这将消耗更多的Token，进而推高算力需求。
因此，模型效能的提升不仅不会“杀死软件”，反而为领先的软件公司创造了价值。
野村强调，需要关注那些能率先利用新一代大模型能力，打造出颠覆性AI原生应用或智能体的软件公司。它们的增长天花板可能因模型能力的飞跃而被再次推高。

922b3eb6 发表于 2026-2-11 11:16

V4：让AI省钱，让老板笑醒

xuye004 发表于 2026-2-11 11:16

DeepSeek V4这mHC和Engram技术就像给老电脑换高速硬盘和优化系统，国产芯片短板能补不少，就是不知道实际用起来稳不稳

诛仙九妹 发表于 2026-2-11 11:17

@元宝利好A股哪方面

陪着寂寞看孤单 发表于 2026-2-11 11:38

软件只是辅助，硬件才是基础

颠颠发表于 2026-2-11 11:42

DeepSeek表示，自己压力很大，基本是007，不是996

oppledr 发表于 2026-2-11 11:55

风头已过

颠颠发表于 2026-2-11 11:57

高端芯片最重要，算力上的优化，只能在一段时期、一定范围内保持追赶不落后，终归还是要硬件跟得上，够先进才行，就像一台电脑，如果内存永远都是2个G，再怎么优化算力，也只能是在2G范围内折腾，终究还是落后于别人16G内存，代差只是时间问题

qqwa1234 发表于 2026-2-11 12:12

@元宝如果让你来设计，你会怎么做？

—じ☆ve人生— 发表于 2026-2-11 12:13

中国是个突飞猛进发展中的国家，必须脚踏实地努力奋斗实现梦想和目标，而不是拨苗助长急于求成。

页: [1] 2

精睿.网络安全's Archiver

春节见？DeepSeek下一代模型：助力中国突破“算力芯片和内存”瓶颈