yukamu 发表于 2023-3-4 13:08

16个SM

KaaPexei 发表于 2023-3-4 13:12

如果是多个SM同时运行一个block,那么SM内部的shared memory怎么解释,为什么是设计在一个SM内部的,并且如果一个核函数对应一个grid,那么核函数内部定义的贡献内存变量怎么解释?还是说整个GPU上的共享内存在所有SM内部都共享?

unityloverz 发表于 2023-3-4 13:16

5210是物理核心数量,几十万个线程是逻辑数量,调度器可以将逻辑数量会分批映射到物理数量上运行。目前CUDA,一个block只能在一个SM上运行,但一个SM可以运行多个block

johnsoncodehk 发表于 2023-3-4 13:21

感谢感谢QWQ[爱]
页: 1 [2]
查看完整版本: 2.1.GPU硬件架构