之前Turing架构显卡内部分成四个部分 ,分别是FP32、int32、RT Core以及DNN Processor, 按照Turing时期的宣传方式,fp32+int32组成一个Shader,即一个Cuda Core, 但是安培最显著的一点变化就是int32也能够跑fp32了,这就造成原本int32+fp32的两组单元理想情况下可以实现2倍fp32,然后int32+fp32这种组合就被NVIDIA顺理成章的宣传成了两个Cuda Core, 所以安培卡我觉得还是依照官方宣传Cuda Core数量除以二来看比较好,因为这毕竟不是真的fp32翻倍了,这是最理论情况下的fp32翻倍 举个例子就像是一个人能够手脚都能做精细活,但是能说他什么时候都能有两个人的工作效率吗?只是比较理想或者比较片面的场景能够发挥出媲美两个人的效率。
您需要 登录 才可以下载或查看,没有账号?立即注册
使用道具 举报
本版积分规则 发表回复 回帖并转播 回帖后跳转到最后一页
小黑屋|手机版|Unity开发者联盟 ( 粤ICP备20003399号 )
GMT+8, 2025-5-14 10:19 , Processed in 0.447385 second(s), 26 queries .
Powered by Discuz! X3.5 Licensed
© 2001-2025 Discuz! Team.