如何判断算法是否有可优化空间?
如何判断算法是否有可优化空间? 除了FLOPs, 我们还有什么别的因素需要考虑呢, 比如memory access cost一类的? 这个也需要考虑,可以参考shfflenet v2 1乘1的推导,在计算机一定的情况下,前后两个卷积层的通道数相同速度最快,但目前cnn的通用范式没有太多这种特殊情况,一般网络确定了,通道就确定了,所以看flops比较合理 计算量,发错了 请教一下,看了您后一篇文章,知道cpu用的是单核A53,如果按照理论峰值的估算公式(比如文中提到的i7 4790k峰值是2*8*2*4*4),那么单核a53您算出的峰值是多少啊,跟您用汇编跑出来的公式差多少呢? 用汇编跑出来的峰值,打错了
页:
[1]