momentum还有一个变种算法NAG(Nesterov accelerated gradient),梯度计算中也加入动量,变为 ,其他计算不变,拟合速度前期比momentum快很多
特别地,上面的一些函数形式后面会多次用到,这里顺带一并记录, 我们把下面形式的函数称为指数加权平均 该函数式的含义是:第 个数据其实是前 个数据加权和,其中, 为前面每一个数的权重的衰减指数,即越靠前的数据对当前结果的影响较小, 值一般设置较大,例如0.9 将下面形式的函数称为均方根误差
您需要 登录 才可以下载或查看,没有账号?立即注册
使用道具 举报
本版积分规则 发表回复 回帖并转播 回帖后跳转到最后一页
小黑屋|手机版|Unity开发者联盟 ( 粤ICP备20003399号 )
GMT+8, 2024-11-16 21:28 , Processed in 0.091081 second(s), 26 queries .
Powered by Discuz! X3.5 Licensed
© 2001-2024 Discuz! Team.