找回密码
 立即注册
查看: 289|回复: 0

【伯克利博士论文】用于设计优化与控制的预训练智能体

[复制链接]
发表于 2023-2-23 18:22 | 显示全部楼层 |阅读模式

近年来,我们已经看到了预训练神经网络来学习可迁移到视觉和NLP中看不见的下游任务的表征的巨大好处。然而,这种学习范式在诸如设计优化或控制等决策方面的研究还不多。在这篇论文中,我们概述了两个问题设置,可以受益于在决策制定的背景下的预训练。首先,我们描述了一个用于自动化设计优化的设置,特别是电路设计优化,在该设置中,特定领域的先验数据可以有效地提高基于模型的优化方法的样本效率。本文对如何提高基于模型的进化算法和贝叶斯优化方法的样本效率提出了新的思路,并进行了实证和理论分析。在第二个问题设置中,我们将讨论如何从大型任务无关数据集中利用无监督的预训练来提取行为表征,并进行少量的模仿学习。我们发现,当新任务的例子演示稀缺时,预训练agent提取技能是使他们准备进行少样本模仿的一个实用方向。
https://www2.eecs.berkeley.edu/Pubs/TechRpts/2022/EECS-2022-35.html



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
懒得打字嘛,点击右侧快捷回复 【右侧内容,后台自定义】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Unity开发者联盟 ( 粤ICP备20003399号 )

GMT+8, 2024-11-16 12:32 , Processed in 0.090129 second(s), 26 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表