yukamu 发表于 2023-3-4 13:08
16个SMKaaPexei 发表于 2023-3-4 13:12
如果是多个SM同时运行一个block,那么SM内部的shared memory怎么解释,为什么是设计在一个SM内部的,并且如果一个核函数对应一个grid,那么核函数内部定义的贡献内存变量怎么解释?还是说整个GPU上的共享内存在所有SM内部都共享?unityloverz 发表于 2023-3-4 13:16
5210是物理核心数量,几十万个线程是逻辑数量,调度器可以将逻辑数量会分批映射到物理数量上运行。目前CUDA,一个block只能在一个SM上运行,但一个SM可以运行多个blockjohnsoncodehk 发表于 2023-3-4 13:21
感谢感谢QWQ[爱]
页:
1
[2]