找回密码
 立即注册
楼主: RhinoFreak

漫谈高性能计算与性能优化

[复制链接]
发表于 2023-1-24 08:37 | 显示全部楼层
我觉得还是有所谓“通用”的方法的,只不过不是做体系结构的人习惯的one-structure-fit-for-all,而是一种思路。其实所谓“加速”或者“性能优化”的本质就是让软件充分利用计算硬件,提升利用率,从而逼近理论性能上限。从这个角度,“通用方法”就是:分析计算部件停顿的原因-选择合理的计算模型减少数据依赖和对流水线的破坏(能兼顾缓解访存墙更好)-通过专用硬件或者结构优化消除剩下的瓶颈,然后不断迭代上述过程,直至各方面因素达到平衡。
发表于 2023-1-24 08:38 | 显示全部楼层
感谢张老师指导[赞同]。选择合适的计算模型来减少数据依赖,这个是不是需要对算法也要做一些调整,让更多的计算并行起来。或者说做ping pong操作取一些数据然后才能让更多的计算单元跑起来。
发表于 2023-1-24 08:41 | 显示全部楼层
这个不一定,有的可能就是对公式做个变形。比如我们那篇论文里就是把NTT从蝶式计算转变为矩阵运算
发表于 2023-1-24 08:44 | 显示全部楼层
嗯嗯嗯,明白了哈。
发表于 2023-1-24 08:51 | 显示全部楼层
作者写的很好[爱]学习了
发表于 2023-1-24 09:01 | 显示全部楼层
感谢支持[调皮]
发表于 2023-1-24 09:10 | 显示全部楼层
感谢支持哈
发表于 2023-1-24 09:11 | 显示全部楼层
加个v
懒得打字嘛,点击右侧快捷回复 【右侧内容,后台自定义】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Unity开发者联盟 ( 粤ICP备20003399号 )

GMT+8, 2024-11-16 04:37 , Processed in 0.089814 second(s), 23 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表