夜间模式 切换到宽版

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 38|回复: 1

[综艺大观] 让DeepSeek V4发挥最大能力!我深度使用两天之后,总结了这些内容

[复制链接]
  • 打卡等级:功行圆满
  • 打卡总天数:793
发表于 2026-4-30 05:57 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
导读:本文介绍DeepSeek V4 如何激发最大思考能力,V4这个模型优势和擅长的领域,以及一些个人深度使用的感受。
DeepSeek我写过很多次,他们实事求是的做事风格,到极客的开源精神都很对我胃口。在这个各家动不动就 “震惊” 、“惊呆在椅子上”、“探索宇宙真理”、“太强以至于不能发布”的时代,他们却能认真的做好自己的事情,清醒的说出 “接近 Opus 4.6 非思考模式,但仍与 Opus 4.6 思考模式存在一定差距”其实DeepSeek这次最大的贡献并不是分数多高,而是国产化的重要一步!从论文上来看,这次训练依然是使用的英伟达的芯片,是以英伟达GPU 为核心华为昇腾 NPU 参与验证与部分训练的混合硬件策略,为未来训练段用国产芯片做了探索

运行推理已经是跑在了国产算力之上,并且半年之后,昇腾950超节点批量上市后,Pro的价格会大幅下调。
也就是说大模型:训练、推理两个环节,已经有一个实现了国产化。

从芯片到模型,从硬件到软件,一条完整的国产 AI 产业链正在形成。

如果未来训练也实现了国产化,那么将出现一个从芯片到模型全栈国产化的解决方案。
老黄的AI五层蛋糕,将会被中国AI全栈方案分走一大块,毕竟不是所有人都用的起那么贵的AI。
1.webp

如何让V4开启最强思考Max模式?
DeepSeek-v4 pro版本有个最大思考模式,开启这个模式能够发挥模型最强能力。
你只要在问问题前,加上以下提示词就可以开启思考max版本:
最大思考能力,绝对最大强度(不允许任何捷径)。
你必须进行极其全面、深入的思考,对问题进行彻底拆解,找到根本原因;并对你的逻辑进行严格检验,覆盖所有可能路径、边界情况以及对抗性场景。请明确写出完整的思考过程,记录每一个中间步骤、被考虑的备选方案以及被否定的假设,确保没有任何一个前提被忽视或未经验证。
实战测试一下效果,我让其生成小球双摆模拟
普通版本提示词:两个小球双摆测试html输出
结果生成的文件直接报错,不可以使用....
2.webp

让v4修改,这次可以正常运行了,下面的视频就是效果。
虽然上面视频中摆动还算正常,但是两个小球会超出画面,整体感官并不好。
我们增加那段提示词,然后再次生成,看看开启max思考能力的DeepSeek V4有多强!
这次的内容一次就生成了,而且可以看出,底部功能更加丰富。增加了加速、减速、扰动、幽灵等功能。
不仅可以控制速度快慢,还能增加多个双球钟摆效果,而且还可以给系统增加个扰动。画面看起来也更加和谐,没有超出画布的情况,可以说是满分!
除此之外,我还测试了两种模式下,生成小船漂浮在大海的3D效果
普通版本的v4效果如下图,可以说完全不能用。
3.webp

开启最强思考模式之后,V4输出的效果可就好很多了,波浪高低都可调节,小船也能正常的在海浪上漂浮。
所以,满血版本的V4能力是十分强大的,但是速度会很慢,建议只有在复杂的任务情况下才需要开启这个。

V4擅长哪些领域?不擅长什么?

通过对技术报告的研究,以及这几日使用体验,我觉得V4目前最擅长的是脚本级别的复杂算法的生成。
V4 LiveCodeBench分数全球第一
这个测试主要看模型写代码、解算法题、处理编程挑战的能力,也就是说用V4写一些算法,性能优化,写python脚本,搞一些我上面做的3D模拟效果很擅长。
对于工程化的任务,比如让其在一个庞大的项目中增加一个复杂功能,它可能会表现不如Claude、GPT、甚至是国内的GLM5.1、kimi2.6。
根据上面的特点,编码开发过程中,业务逻辑可以交给GLM和kimi,如果遇到复杂算法就交给DeepSeek。
题外话:目前大模型编程能力个人感觉排名如下:
第一梯队:Claude、GPT
第二梯队:GLM5.1、Kimi2.6、Mimo 2.5Pro、DeepSeek V4
第三梯队:别用了,浪费时间,浪费生命
4.webp

V4 Apex Shortlist分数全球第一
这个测试是一组被筛出来的“高难数学/推理题精选集”,V4 在 这个第一,说明它更善于推倒复杂问题,普通模型可能直接给结论,V4先把问题拆成几块,再逐块推,最后合并结论。
也就是说V4十分适合做大脑,能帮你做全面的商业分析,复杂决策,技术方案判断。
拿之前那个问住很多大模型的“洗车问题”,V4轻松回答。
5.webp

但是V4缺点也很突出,就是工具调用能力距离顶尖模型差距很大。
也就是说搜索新闻,多信息源汇总,多步骤搜索整理不是它强项。
一句话总结:
  • 打卡等级:已臻大成
  • 打卡总天数:482
发表于 2026-4-30 08:26 | 显示全部楼层
看看
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )|网站地图

GMT+8, 2026-4-30 08:54 , Processed in 0.151099 second(s), 5 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表