NVIDIA Ada Lovelace架构解析:GeForce RTX 40系列性能翻倍的秘辛

2022-09-22 09:45:38佚名

Ada Lovelace 架构的基础其实很类似前一代的 Ampere 架构,同样以SM (Streaming Multiprocessor) 为构成单位,每组SM 内含128个 CUDA Core、1个RT Core 和4个Tensor Core。

这128个CUDA Core 和 Ampere 架构一样,其中一半专责处理FP32(32 位元浮点数,又称单精度浮点数)运算,另一半则可依需求,在 INT32(32 位整数)运算和FP32 运算之间动态切换。

NVIDIA Ada Lovelace架构解析:GeForce RTX 40系列性能翻倍的秘辛(图1)

根据NVIDIA 提供的资料,完整的 Ada Lovelace 架构AD102 晶片拥有144 组SM,这包含多达18432 个CUDA Core、144 个第3 代RT Core 和576 个第4 代Tensor Core,并且配倍2 个可处理 AV1 编码的第8 代NVENC 编码器,整体规模比前代大了不少。

另外在TSMC台积电4nm,4N NVIDIA 客制化制程的加持下,AD102 晶片的电晶体数量来到763 亿个,且Boost 时脉可达2.5 GHz。在同样功耗下,性能表现可达 Ampere 架构的2倍。而且相较于 Ampere 架构大约在350W 左右就达到效能顶点,Ada Lovelace 架构可一路增加至450W,依旧维持有效的效能成长。

NVIDIA Ada Lovelace架构解析:GeForce RTX 40系列性能翻倍的秘辛(图2)

相关文章

推荐软件

猜你喜欢