找回密码
 立即注册
楼主: mypro334

一文看懂各种神经网络优化算法:从梯度下降到Adam方法

[复制链接]
发表于 2021-7-10 15:06 | 显示全部楼层
adaptive系列的都是在做preconditioning, 改变地形。只是罗列公式,也不给出原始论文,根本没有价值。
发表于 2021-7-10 15:12 | 显示全部楼层
实际上那些adaptive的方法最后效果都没有SGD效果好。
发表于 2021-7-10 15:15 | 显示全部楼层
这是copy的?这是别人的译文:http://blog.csdn.net/google19890102/article/details/69942970
发表于 2021-7-10 15:22 | 显示全部楼层
反向传播技术(Backpropagation)早就有了好吧。。。
发表于 2021-7-10 15:32 | 显示全部楼层
搬运工要指明出处吧
发表于 2021-7-10 15:33 | 显示全部楼层
区别
发表于 2021-7-10 15:43 | 显示全部楼层
这种方法有时候还是被成为SGD。?是称为
发表于 2021-7-10 15:52 | 显示全部楼层
翻译的好渣
发表于 2021-7-10 15:53 | 显示全部楼层
小批量梯度下降。。。有点萌啊这翻译。。
发表于 2021-7-10 15:54 | 显示全部楼层
2006年引入的反向传播技术。。。
懒得打字嘛,点击右侧快捷回复 【右侧内容,后台自定义】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Unity开发者联盟 ( 粤ICP备20003399号 )

GMT+8, 2024-9-21 04:20 , Processed in 0.166752 second(s), 23 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表