夜间模式 切换到宽版

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 52|回复: 1

[科技新闻] DeepSeek API又降价了,输入缓存价格仅为GPT-5.5的七百分之一

[复制链接]
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2026-4-27 16:15 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
1.webp


4月26日晚间,DeepSeek官网宣布全系API服务输入缓存命中价格降至原有价格的十分之一。Pro模型在2026年5月5日前叠加2.5折限时优惠。
这是DeepSeek连续第二日调整API价格,前一日该平台刚刚宣布V4-Pro模型API限时2.5折降价。
最新调价后,面向高速与低成本场景的DeepSeek-V4-Flash每百万tokens输入缓存命中价格为0.02元。
面向企业级用户的DeepSeek-V4-Pro输入缓存命中价格为0.1元/百万Tokens,叠加2.5折限时特惠后实际降至0.025元/百万Tokens,缓存未命中输入从12元降至3元,输出从24元降至6元。
对比调价前后,高频调用、长文本处理场景成本降幅超过90%。RAG知识库、智能客服、文档分析等缓存命中率高的应用,可直接实现商用成本断崖式下跌。
DeepSeek-V4预览版于4月24日正式发布并同步开源,号称在Agent能力、世界知识与推理性能三大维度达到国内及开源领域领先水平。发布次日调用量已有明显增长。
数据显示,4月25日DeepSeek V4-Pro在OpenRouter上的调用量达到136亿Token,较前一日增长近四倍。
新模型两款版本均支持100万token超长上下文,Pro版单token算力仅为V3.2的27%,KV缓存降至10%,从底层实现成本优化。
一个值得关注的时间点是,4月23日OpenAI刚刚发布新一代旗舰模型GPT-5.5 Pro,API定价为每百万Token输入30美元、输出180美元,批量处理和弹性定价享受半价优惠。
26日消息显示,DeepSeek-V4-Pro叠加限时优惠后的缓存输入价仅为GPT-5.5Pro的七百分之一。
降价公告发布的同时,DeepSeek-V4完成了对华为昇腾NPU的正式适配,成为首个在官方技术文档中明确认证支持国产AI芯片的万亿参数级大模型。
DeepSeek-V4的技术报告将细粒度专家并行(EP)方案同时在英伟达GPU和华为昇腾NPU上完成验证。
价格下调和昇腾950超节点批量上市同步,业内认为这显示出DeepSeek-V4或与国产算力芯片做针对性的深度联动适配。
上海财经大学特聘教授胡延平表示,DeepSeek此举意在延揽更多用户,尤其是企业用户、开发者和各类Agent用户。
近几个月国际国内主要模型服务的资费都有较大幅度上涨,DeepSeek在资费方面再次压低行业价格预期。
在OpenAI涨价、Anthropic转向按算力计费、谷歌推出多档位按需定价的行业背景下,DeepSeek选择了另一条路。
不过,DeepSeek方面此前已在V4发布时以注释小字说明:受限于高端算力,目前Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,价格还会继续下探。
这意味着,0.025元/百万Tokens未必是这条降价曲线的终点。
[本文作者i黑马,i黑马原创。如需转载请联系微信公众号(ID:iheima)授权,未经授权,转载必究。]
  • 打卡等级:自成一派
  • 打卡总天数:251
发表于 2026-4-27 21:14 | 显示全部楼层
看了LZ的帖子,我只想说一句很好很强大!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )|网站地图

GMT+8, 2026-4-28 03:57 , Processed in 0.144850 second(s), 5 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表