另外,包括 YouTube 、Cat Finder 、 AlphaGo 、 GPT-3 、 GPT-4 在内, AI 历史上那些叫得出名的玩意,几乎都是在英伟达的硬件上整出来的。
英伟达的硬件,仿佛就是新时代的内燃机,载着 AI 时代不断前进。
差友们可能会有点疑问,为什么在 AI 爆发的时代,好像就只有老黄有好处,其它的显卡生产商们的显卡不能训练 AI 嘛?能训练,但只能训练一点点。
为啥?这就不得不提到英伟达从 2006 年就开始着手开发一个东西—— CUDA ( 统一计算设备架构 )。
差评君简单解释一下它是干嘛的,当你想要计算一些比较庞大的运算问题时,通过 CUDA 编程,你就能充分利用 GPU 的并行处理能力,从而大幅提升计算性能。
差评君说一个听来的比喻。
CPU 就好比是个数学教授, GPU 就是 100 个小学生,放一道高数题下来那 100 个小学生可能会懵逼;但是放 100 道四则口算题下来,那 100 个小学生同时做肯定比数学教授快多了。
深度学习就是上面的例子中那 100 道口算题,那个让 GPU 处理器并行运算的 “ 工具 ” 就叫 CUDA 。
一般来说,使用 CUDA 和不使用 CUDA ,两者在计算速度上往往有数倍到数十倍的差距。
既然 CUDA 这么有用,为什么其它的 GPU 厂商不去搞个竞品呢?不是不去搞啊,而是他们真的没想到!
在早期, GPU 的作用只是为了加速图形渲染,各大厂商们认为它就是一个图形专用计算芯片,并没有想到把 GPU 用在其它通用计算方面。至于拿来做深度学习?以那个年代的 AI 能力,一是没有太大的必要,二是也没有人觉得它有用。
英伟达深度学习团队的布莱恩在聊到 CUDA 时这么说道:
“ 在 CUDA 推出十年以来,整个华尔街一直在问英伟达,为什么你们做了这项投入,却没有人使用它?他们对我们的市值估值为 0 美元。 ”
在这之后又经过了 4 年,那些搞深度学习的人才突然意识到, GPU 的这种设计结构方式,在训练 AI 的速度上,真的是 CPU 不能比的。而拥有了 CUDA 原生支持的英伟达 GPU ,更是首要之选。
到现在,资本们已经看到了 AI 的重要之处,为什么大家都还在卷 AI 模型,而不去卷老黄的市场呢?
原因在于,它们已经很难再拿到 AI 加速芯片的入场券了。在人工智能产业上,整个深度学习的框架已经是老黄的形状了。
AI 发展的数十年间,英伟达通过对 CUDA 开发和社区的持续投入, CUDA 和各类 AI 框架深度绑定。
当今使用排行靠前的各类 AI 框架,就没有不支持 CUDA 的,也就是说你想要让你的深度学习跑的快?买张支持 CUDA 的高性能卡是最好的选择,说人话就是——买 N 卡吧。
当然,在 CUDA 大力发展期间,也有其它公司在尝试着打破英伟达这种接近垄断的局面。
2008 苹果就提过出 OpenCL 规范,这是一个统一的开放 API ,旨在为各种不同的 GPU 型号提供一个规范,用以开发类似 CUDA 的通用计算软件框架。
但是,通用就意味着不一定好用。
而随着 OpenAI 对大模型 AI 的成功验证,各家巨头对大模型 AI 的纷纷入局,英伟达的卡已经立马成了抢手货。
所以如今的 AI 创业公司,出现了一件很有意思的现象,在他们的项目报告上,往往会搭上一句我们拥有多少块英伟达的 A100 。
当大家在 AI 行业纷纷投资淘金时,英伟达就这样靠着给大家卖水——提供 AI 加速卡,大赚特赚,关键还在于,只有它卖的水能解渴。
因为它的硬件以及工具集,已经能影响到整个 AI 产业的战局和发展速度了。
更可怕的是,英伟达的优势已经形成了一种壁垒,这壁垒厚到就连全球第二大 GPU 厂商 AMD 都没有办法击穿。
所以在 AI 大浪滔天的现在,能整出属于自己的 AI 大模型固然重要,但差评君却觉得,啥时候能有自己的英伟达和 CUDA 也同样不可小觑。
当然,这条路也更难。
最后,差评君觉得在未来,我们需要抓紧突破的,绝对不只是对人工智能大模型相关的研究,更为重要的是整个计算芯片的设计,制造,以及 AI 生态的建设。
新的工业革命已经到来, AI 技术的发展不仅加速了人类生产力的发展,也加速了那些落后产能的淘汰,现在各行各业都处在变革的前夕。 强者越强,弱者无用。虽然这句话很残酷,但在AI 领域,如果不奋力追上,可能真的已经不需要 “ 弱者 ” 了。