2.1.GPU硬件架构 - 第2页 - 学术研究 Scholarly - Unity开发者联盟

yukamu 发表于 2023-3-4 13:08

16个SM

KaaPexei 发表于 2023-3-4 13:12

如果是多个SM同时运行一个block，那么SM内部的shared memory怎么解释，为什么是设计在一个SM内部的，并且如果一个核函数对应一个grid，那么核函数内部定义的贡献内存变量怎么解释？还是说整个GPU上的共享内存在所有SM内部都共享？

unityloverz 发表于 2023-3-4 13:16

5210是物理核心数量，几十万个线程是逻辑数量，调度器可以将逻辑数量会分批映射到物理数量上运行。目前CUDA，一个block只能在一个SM上运行，但一个SM可以运行多个block

johnsoncodehk 发表于 2023-3-4 13:21

感谢感谢QWQ[爱]

页: 1 [2]

Unity开发者联盟's Archiver