找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 103|回复: 1

英伟达 RTX 50 系列显卡全部 CUDA 核心支持 FP32 / INT32 双功能

[复制链接]
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-2-1 18:40 | 显示全部楼层 |阅读模式
IT之家 2 月 1 日消息,英伟达现已公布 Blackwell GPU 架构白皮书,披露了 GeForce RTX 50 系列显卡的大量技术细节,其中相当值得注意的一点是 Blackwell 架构的全部单精度 CUDA 核心同时支持 FP32 / INT32 数据,这点上回归了九年前的 Pascal 架构。


▲ Blackwell 架构 SM 设计


▲ Pascal 架构 SM 设计英伟达在 GeForce 10 "Pascal" 世代仍采用单精度 CUDA 单元兼顾 FP32 / INT32 的设计,而在 Volta 和 Turing 两代上换用了两组 1:1 比例的 CUDA 核心分别承担 INT32 和 FP32 的方案


▲ Volta(左)、Turing(右)两代架构 SM 设计来到 Ampere 架构,英伟达则为每个 SM 流式处理器的四个处理块(IT之家注:Processing Block)之一提供了 1 组 16 个 FP32 / INT32 单元和 1 组 16 个纯 FP32 单元;而在 Ada GPU 上,这一设计得到延续。


▲ Ampere(左)、Ada(右)两代架构 SM 设计Blackwell 架构上的统一 CUDA 使得每 SM 可能的 INT32 整数运算能力较 Ada 翻倍。不过在任何给定的时钟周期内,Blackwell 统一内核只能以 FP32 或 INT32 模式中的一种运行。
英伟达提到,Ada 架构 SM 是为标准着色器设计和优化的,而 Blackwell SM 则是为神经着色器设计和优化的

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册

×
头像被屏蔽
  • 打卡等级:略有所学
  • 打卡总天数:3
发表于 2025-2-27 18:32 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )|网站地图

GMT+8, 2025-5-20 19:54 , Processed in 0.148301 second(s), 5 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表