英伟达近日公布了Blackwell GPU架构的白皮书,详细披露了即将推出的GeForce RTX 50系列显卡的技术细节。其中,Blackwell架构的一个显著特点是其单精度CUDA核心同时支持FP32和INT32数据类型,这一设计回归了九年前的Pascal架构。
在Pascal架构中,英伟达采用了单精度CUDA单元兼顾FP32和INT32的设计,而在随后的Volta和Turing架构中,则改为使用两组1:1比例的CUDA核心分别处理INT32和FP32。到了Ampere架构,英伟达为每个SM流式处理器的四个处理块之一提供了1组16个FP32/INT32单元和1组16个纯FP32单元,这一设计在Ada GPU上得到了延续。
Blackwell架构的统一CUDA设计使得每SM的INT32整数运算能力较Ada架构翻倍。然而,在任何给定的时钟周期内,Blackwell统一内核只能以FP32或INT32模式中的一种运行。英伟达表示,Ada架构的SM是为标准着色器设计和优化的,而Blackwell SM则是为神经着色器设计和优化的。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。