找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 96|回复: 2

[科技新闻] DeepSeek V4,四月见!

[复制链接]
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2026-4-10 21:10 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
1.webp
要说这一年来,最难等到的大模型迭代。

无疑是新年期间扔出王炸、刷屏全网,让硅谷一众科技大厂股价暴跌的DeepSeek了。
2.webp


眼看这一两年间。
3.webp
国产大模型们迭代速度快如闪电、模型能力一节比一节强。
什么多模态、什么 Agent 特化模型搞得飞起。
但这小鲸鱼完全没有大动静,偶尔有点更新,也只是缝缝补补。
4.webp
比如上个 DeepSeek V3.2 给用户解解馋,又或是开源个 OCR 模型,折腾别的技术方向。
5.webp


6.webp
不过好消息是,这回 DeepSeek V4 真要来了。
有报道表示:
DeepSeek 创始人梁文锋近日在内部沟通中透露,DeepSeek 新一代旗舰大模型 DeepSeek V4 将于 4 月下旬正式发布。


7.webp
然后机哥看了眼日期。
这个月只剩二十多天,再怎么跳票,也不可能跳到猴年马月吧。
8.webp



目前 DeepSeek 的官网,已经更新了全新界面。
分为快速模式和专家模式。
9.webp
快速模式咱都很熟悉了,主要负责日常知识问答。
专家模式则负责解决复杂问题,但模型应该还不是 V4。
10.webp


结合可靠爆料来看,真正的 DeepSeek V4,应该会有以下新特性。
11.webp
一个是优化底层架构
这也让它拥有动态推理和静态记忆能力,有效减少 GPU 压力,让长文本处理起来更优雅精准。
12.webp
另一个是流形约束超连接(mHC)。
主要是用来解决,超长上下文的记忆和逻辑关联出错问题。
当然模型参数肯定能达到万亿级别,并且支持原生多模态能力,能真正理解图片、视频和音频了。
13.webp


现在的 DeepSeek 虽然支持上传图片,但本质上使用 OCR 技术去解析图片文字。
14.webp
就 ... 非常老派的做法。
15.webp


16.webp
最后还有个比较有意思的爆料,机哥觉得很有必要提一嘴。
有消息表示。
DeepSeek V4 在前期测试阶段,把早期访问和训练权限,优先提供给包括华为在内的芯片厂商。
17.webp


一般来说。
英伟达和 AMD 的显卡算力更高,大模型厂商在正式开源发布之前,都会把模型放到这俩平台上测试。
18.webp
但很显然,DeepSeek 选择了更 NB 的打法。
19.webp


据说DeepSeek V4,已经深度适配了华为昇腾 950 PR 芯片。
包括阿里、字节跳动和腾讯等科技大厂,也提前预定了一大批高算力 AI 芯片,做足准备。
等DeepSeek V4 正式上线后,就能快速把新模型集成到自家 AI 产品上。
20.webp
至于国产芯片大厂和大模型大厂们,最终会搞出什么火花。
静待四月,揭晓谜底。
图片来自网络
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2026-4-10 22:58 | 显示全部楼层
说优化底层架构减少GPU压力挺诱人但长文本处理优雅精准这话听着虚就像说新手机续航久结果刷两小时视频就没电了
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2026-4-11 08:05 | 显示全部楼层
期待
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )|网站地图

GMT+8, 2026-4-11 15:14 , Processed in 0.289864 second(s), 5 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表