amp
AMP: Adversarial Motion Priors for Stylized Physics-Based Character Control 项目地址: 代码地址: 方法 本论文采用了GAIL算法,虽然名字里带,但是实际上属于RL,而且是IRL(逆强化学习)的一种,巧妙地将IL和RL进行了结合。 逆强化学习IRL(Inverse Reinforcement Learning)则没有奖励,取而代之的是“环境互动+最大化从专家数据学到的奖励函数=最优Actor 逆GAIL(Generative Adversarial Imitation Learning)是使用GAN(Generative Adversarial Network)的IRL,即训练一个生成器GGG ,它从一个普通的分布逐渐生成与现有数据分布相似的分布。GAIL的数据集(参考运动)是{s,a}\{s, a\}{s,a}。同样,我们希望我们的 Actor 能够模仿专家,即 Actor 产生的轨迹(的分布)与专家产生的轨迹(的分布)相似。GAN中的生成器和判别器这里不再赘述。reward是鼓励policy的行为和数...
vim操作
Vim 常用命令 基本模式 普通模式(Normal Mode):默认模式,用于移动和命令 插入模式(Insert Mode):用于输入文本 命令模式(Command Mode):用于执行命令 模式切换 i - 进入插入模式(在光标前插入) a - 进入插入模式(在光标后插入) o - 在下一行插入 O - 在上一行插入 Esc - 返回普通模式 : - 进入命令模式 光标移动 w - 移动到下一个单词开头 b - 移动到上一个单词开头 0 - 移动到行首 $ - 移动到行尾 gg - 移动到文件开头 G - 移动到文件末尾 Ctrl+f - 向下翻页 Ctrl+b - 向上翻页 编辑操作 dd - 删除当前行 D - 删除到行尾 yy - 复制当前行 yw - 复制当前单词 p - 粘贴 u - 撤销 Ctrl+r - 重做 搜索和替换 /关键词 - 向下搜索 ?关键词 - 向上搜索 n - 下一个匹配 N - 上一个匹配 :%s/旧文本/新文本/g - 全文替换 :%s/旧文本/新文本/gc - 全文替换(确认) 保存和退出 :w - 保存文件 :q - ...