找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 20|回复: 6

[数码资讯] 首款专为大规模上下文 AI 设计的 CUDA GPU,英伟达 Rubin CPX 发布

[复制链接]
  • 打卡等级:已臻大成
  • 打卡总天数:561
发表于 2025-9-10 08:34 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
英伟达今日宣布推出新产品 Rubin CPX,这是一款专为大规模上下文处理而设计的专用 GPU,涵盖了像大规模编码和生成视频这样要求高的工作。

该硬件旨在将理解 AI 提示的任务与生成响应的任务区分开,英伟达表示,这将使整个过程对客户的效率更高。



该新硬件预计将作为较大的 Vera Rubin 平台的一部分工作,该平台同时集成了 Vera CPU 和 Rubin GPU。英伟达声称全机架版本 Vera Rubin NVL144 CPX 拥有 8 exaflops 的 AI 性能。



IT之家从英伟达新闻稿获悉,独立的 Rubin CPX GPU 包含 128GB 的 GDDR7 显存。英伟达承诺,新硬件具有 3 倍的 attention capabilities,并使用公司的 4-bit NVFP4 精度提供 30 petaflops 的计算能力。

英伟达 CEO 黄仁勋将 Rubin CPX 与 RTX 进行了比较,他说:“正如 RTX 革新了图形和物理 AI,Rubin CPX 是首款专为大规模上下文 AI 设计的 CUDA GPU,能够在同一时间推理跨越数百万个知识符号的模型。”他还试图量化客户的投资回报,提到部署新硬件的 1 亿美元投资可以产生 50 亿美元的收益。

英伟达表示,该硬件将得到其完整软件栈的支持,包括 Nemotron —— 其一系列开放的多模态模型,专为构建企业级 AI 代理(旨在自主处理复杂任务的系统)而设计。Nemotron 模型提供不同尺寸,从 Nano 用于设备端应用,到 Super 用于单 GPU 设置,再到 Ultra 用于大型数据中心。

英伟达表示,预计 Rubin CPX 将于 2026 年底推出。
  • 打卡等级:自成一派
  • 打卡总天数:311
发表于 2025-9-10 08:52 | 显示全部楼层
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:386
发表于 2025-9-10 09:26 | 显示全部楼层
膜拜神贴,后面的请保持队形~
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:564
发表于 2025-9-10 10:27 | 显示全部楼层
感谢分享!
回复 支持 反对

使用道具 举报

  • 打卡等级:渐入佳境
  • 打卡总天数:34
发表于 2025-9-10 10:43 | 显示全部楼层
优秀帖子,感谢分享。
回复 支持 反对

使用道具 举报

  • 打卡等级:渐入佳境
  • 打卡总天数:30
发表于 2025-9-10 10:52 | 显示全部楼层
英伟达赢麻了
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:552
发表于 2025-9-10 11:25 | 显示全部楼层
谢谢分享。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )|网站地图

GMT+8, 2025-9-11 07:09 , Processed in 0.183603 second(s), 4 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表