找回密码
 立即注册
查看: 459|回复: 9

一份朴实无华的移动端盒子滤波算法优化笔记

[复制链接]
发表于 2021-11-16 07:48 | 显示全部楼层 |阅读模式
一份朴实无华的移动端盒子滤波算法优化笔记
发表于 2021-11-16 07:57 | 显示全部楼层
3x3 直接完全展开,一次读三行/四行,像是 convolution depthwise 3x3
半径很大可以用积分图...
发表于 2021-11-16 08:01 | 显示全部楼层
多谢nihui大佬[欢呼]
发表于 2021-11-16 08:04 | 显示全部楼层
厉害
发表于 2021-11-16 08:10 | 显示全部楼层
看到第5版之后还有几版就知道你要开挂了
发表于 2021-11-16 08:13 | 显示全部楼层
啊这[思考]
发表于 2021-11-16 08:22 | 显示全部楼层
能问一下,水平和垂直处理耗时比吗
发表于 2021-11-16 08:24 | 显示全部楼层
第三版有个笔误,//shuipin 那个for循环
colsumPtr[X] += colsumPtr[Stride + X]应改为
colsumPtr[X] += cachePtr[Stride + X]
发表于 2021-11-16 08:33 | 显示全部楼层
自己测一下
发表于 2021-11-16 08:38 | 显示全部楼层
请教大佬是用什么工具统计程序的ARM平台耗时?[拜托]
懒得打字嘛,点击右侧快捷回复 【右侧内容,后台自定义】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Unity开发者联盟 ( 粤ICP备20003399号 )

GMT+8, 2024-11-15 22:29 , Processed in 0.095117 second(s), 25 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表