找回密码
 立即注册
楼主: maltadirk

2.1.GPU硬件架构

[复制链接]
发表于 2023-3-4 13:08 | 显示全部楼层
16个SM
发表于 2023-3-4 13:12 | 显示全部楼层
如果是多个SM同时运行一个block,那么SM内部的shared memory怎么解释,为什么是设计在一个SM内部的,并且如果一个核函数对应一个grid,那么核函数内部定义的贡献内存变量怎么解释?还是说整个GPU上的共享内存在所有SM内部都共享?
发表于 2023-3-4 13:16 | 显示全部楼层
5210是物理核心数量,几十万个线程是逻辑数量,调度器可以将逻辑数量会分批映射到物理数量上运行。目前CUDA,一个block只能在一个SM上运行,但一个SM可以运行多个block
发表于 2023-3-4 13:21 | 显示全部楼层
感谢感谢QWQ[爱]
懒得打字嘛,点击右侧快捷回复 【右侧内容,后台自定义】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Unity开发者联盟 ( 粤ICP备20003399号 )

GMT+8, 2024-11-24 03:57 , Processed in 0.065225 second(s), 20 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表