找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 68|回复: 1

[科技新闻] DeepSeek新一代模型犹抱琵琶半遮面,算力平权与潜在应用大爆发

[复制链接]
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-8-30 22:26 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
1.webp




【摘要】2025年7月,摩根士丹利发布重磅研报,泄露DeepSeek R2的三大核心突破:参数翻倍、成本骤降88%、全面部署国产昇腾910B芯片。

R2的发布不仅是一款大模型产品的升级,更是一次AI产业链上下游的系统性重构事件。

软件、算力、硬件、芯片、终端无一例外都吃到了成本红利,国产AI芯片也借此迎来关键机遇。

以下是正文:



01

成本骤降、参数翻倍:R2带来的性能成本拐点



相较于前代,DeepSeek R2实现了成本与性能的双重突破:

首先是使用成本的大幅降低。

R2的输入成本仅为每百万Token 0.07美元,显著低于R1的0.15–0.16美元;输出成本则从R1的2.19美元降至0.27美元,下降幅度达到87%。

进一步与OpenAI的GPT-4o对比,后者输入成本为2.50美元、输出成本高达10.00美元,R2在整体调用成本上比GPT-4o便宜约97%,为开发者和企业带来了前所未有的性价比。

不仅如此,R2在模型能力上也实现质的飞跃。

与作为纯语言模型的R1不同,R2是一款多模态模型,支持图像、音频等非结构化数据输入,并在多语言处理、代码生成和推理时间缩放等维度进行了深度优化。

其参数规模从R1的6710亿跃升至1.2万亿,活跃参数达到780亿,为AI应用的复杂场景提供了更强大的支撑。

更重要的是,R2在底层硬件上没有选择NVIDIA的 H100,转而采用国产的华为昇腾910B。



02

昇腾910B登场



DeepSeek R2的训练全过程采用了华为昇腾910B芯片,标志着国产芯片首次全面参与千亿参数级大模型实战,是AI算力自主化进程中的重要突破。

昇腾910B采用3D Cube矩阵计算引擎,使芯片利用率提升至92%,并通过达芬奇架构实现算力的高效释放。

在算力层面,昇腾910B在FP16精度下单卡计算性能达到280 TFLOPS,INT8精度下为140 TOPS;集群训练的整体性能可达FP16精度下512 PetaFLOPS,芯片利用率达82%,整体性能相当于英伟达上一代A100集群的91%。

在具体任务表现上,昇腾910B在中文NLP任务中的效率比英伟达H20高出18%,其在混合精度计算能力和显存管理方面的表现,在特定场景下甚至优于部分英伟达高端芯片。

总的来说,昇腾910B在确保模型性能的同时大幅压缩了成本,为我国摆脱海外芯片依赖,构建自主AI算力底座奠定了坚实基础。



03

AI芯片从点状突破到链式协同



2025年全球AI芯片市场规模预计突破1200亿美元,年均复合增长率超25%。其中,数据中心AI芯片占比超60%,边缘计算芯片增速达35%。

据产业链估计,2025年上半年半导体设备进口额同比降12% ,本土企业全球份额从3%升至8%,这无疑说明了国产替代进程的加速。

随着DeepSeek R2选择全面采用昇腾910B芯片,国产AI芯片产业从单点技术突破进入产业链协同成熟的新阶段。

纵观当前产业格局,从上游的设计工具EDA,到晶圆制造、封测,再到光刻设备,已初步形成闭环体系。

封测环节上,长电科技、通富微电等龙头企业产能稳步提升。

在刻蚀、薄膜沉积等关键设备上,北方华创和中微公司等国产设备厂商取得重大突破,部分技术能力已达到5纳米及更先进工艺水平。

伴随产业链环节逐渐贯通,AI芯片企业迎来系统性成长。

典型代表寒武纪,在2025年一季度实现营收11.11亿元,同比大增4230.22%,显示出AI芯片需求爆发带来的巨大市场空间。

未来,华为还将尝试从ASIC(专用集成电路)转向 GPGPU(通用图形处理器)芯片,直击英伟达技术壁垒。

截至 2025年5月,昇腾生态已覆盖665万开发者、8800家合作伙伴,完成 2.39万个解决方案认证,初步形成了规模化自主算力体系。



04

芯片、算力、应用迎来利好



在 DeepSeek R2 成本骤降、国产芯片突围的推动下,中国AI产业链将迎来全局性进展,各层级企业都出现结构性机会。

在软件应用层,AI服务商将成为首批受益者。

随着R2模型调用成本下降至每百万Token仅0.27美元,AI内容生成、教育辅助、电商推荐、音视频处理等领域的创业公司将首次拥有大模型级算力的平权入口。

低成本训练与推理能力将促使AI快速向基础设施转变,催生一波面向垂类场景的轻量应用。

在算力层,围绕昇腾910B等国产芯片构建的算力基建企业将率先受益。

在芯片层,除了昇腾910B主导的训练集群芯片生态之外,寒武纪、燧原科技、天数智芯等AI芯片公司也已实现产品量产,并逐步融入大模型推理侧应用。

值得注意的是,这些芯片厂商已与MindSpore、PyTorch等主流深度学习框架建立协同适配机制,为大模型推理阶段提供弹性硬件基础。

端侧落地层,轻量模型的兴起使AI功能下沉至智能硬件成为可能。

乐鑫科技、全志科技等芯片厂商正在探索将大数据模型应用于AI耳机、AI儿童教育玩具、AI翻译器等产品,推动AI真正从云端走向本地场景。

随着R2多模态能力开放,语音与图像识别也将在端侧得到更多支持。

在服务商业模式层,API调用成本的大幅下探,将打破以往按Token计费的高门槛局限,为“免费+增值”模型提供落地基础。

AI应用方将通过免费调用基础服务吸引流量,再通过定制化输出、私有化部署等方式拓展营收空间。

这对ToC和ToB赛道的商业化均可形成直接利好,加速产品市场转化周期。

总体而言,DeepSeek R2 的技术升级不仅体现在推理能力与多模态覆盖,其更重要的产业意义在于撬动了全产业链从芯片到底层基建、再到应用与商业化的系统性降本增效。



05

尾声



DeepSeek R2 的问世不仅是一场模型性能与成本结构的迭代,其副产品是推动了中国AI产业链内一场关于自主算力、国产芯片、模型应用的融合。

昇腾910B的应用是国产芯片的一个开端,大模型训练的实战验证正在实实在在地推进各家产品走上核心算力舞台。

DeepSeek R2 的意义在于,国产模型得以反哺国产芯片、成本革命正在催化应用扩展,替代的转折点正在快速到来。下一步的关键,是哪家企业能承得住AI全链条的蓬勃生长。
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-8-30 22:38 | 显示全部楼层
小作文?
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )|网站地图

GMT+8, 2025-9-12 12:14 , Processed in 0.166058 second(s), 8 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表