找回密码
 立即注册
楼主: ChuanXin

机器学习中的高性能计算(二)SSE优化

[复制链接]
发表于 2022-7-17 07:57 | 显示全部楼层
陈老师请问`__m128 vdata_1 = _mm_loadu_ps(&input[y][x]);`这句,如果坐标在右边界,那么&input[y][x]后面的地址就不对了,为什么_mm_loadu_ps不会出错呢?
发表于 2022-7-17 07:58 | 显示全部楼层
的确会有越界的问题,感谢提醒。至于不报错的原因,可能因为并不妨碍从内存读取“脏数据”,但是这点我不是很确定,纯猜测。
发表于 2022-7-17 08:05 | 显示全部楼层
报什么错误呢?
发表于 2022-7-17 08:13 | 显示全部楼层
SSE中有scalar类型的指令,可以执行非vector的计算。如果数据量不是4的倍数,可以“浪费”一点,这个overhead并不高
发表于 2022-7-17 08:19 | 显示全部楼层
谢谢解答,不报错而且值是对的,就很奇怪[飙泪笑]。这系列写得很好,期待您的下篇文章[爱]。
发表于 2022-7-17 08:27 | 显示全部楼层
接-化-发,,
懒得打字嘛,点击右侧快捷回复 【右侧内容,后台自定义】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Unity开发者联盟 ( 粤ICP备20003399号 )

GMT+8, 2024-5-5 16:23 , Processed in 0.117653 second(s), 23 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表