找回密码
 立即注册
楼主: yukamu

梯度下降法、牛顿法和拟牛顿法

[复制链接]
发表于 2022-1-2 15:40 | 显示全部楼层
您好、文中说“步长,由一维搜索确定”,不是很懂,步长学习率不是通过检验数据来自行选取嘛,这玩意儿还能够动态?谢谢指教
发表于 2022-1-2 15:50 | 显示全部楼层
明白了,算法中的最优化lambda步长是理想状态的,但是无法实现,所以现实求解中才用固定lambda,靠验证集来选取一个合适的学习率,应该莫得问题把这种理解
发表于 2022-1-2 15:59 | 显示全部楼层
写得太好了,比较系统,而且一看就懂
发表于 2022-1-2 16:05 | 显示全部楼层
[赞同][赞同][赞同]
发表于 2022-1-2 16:08 | 显示全部楼层
“拟牛顿条件(Secant equation)” 上面记 y, sigema  下标有问题,应该是k-1,而不是k
发表于 2022-1-2 16:16 | 显示全部楼层
拟牛顿法处理单方程和方程组的时候需要再进行方程组向单方程转化吗[好奇]
发表于 2022-1-2 16:24 | 显示全部楼层
BFGS算法用B近似H,还是要求B逆,不会存在问题么?
发表于 2022-1-2 16:33 | 显示全部楼层
5: BFGS(Broyden-Fletcher-Goldfard-Shano)算法(BFGS algorithm)那里第三个公式应该是第二个公式左右乘以δk得来的吧?这样和后面求Qk才对的上。
发表于 2022-1-2 16:41 | 显示全部楼层
DFP里面为什么要冒出两个转置矩阵?
发表于 2022-1-2 16:45 | 显示全部楼层
DFP里面为什么要冒出两个转置矩阵?
懒得打字嘛,点击右侧快捷回复 【右侧内容,后台自定义】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Unity开发者联盟 ( 粤ICP备20003399号 )

GMT+8, 2024-9-22 23:37 , Processed in 0.089852 second(s), 23 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表