刘骞的博客

发表于2025-11-19|locomoion

AMP: Adversarial Motion Priors for Stylized Physics-Based Character Control 项目地址：代码地址：方法本论文采用了GAIL算法，虽然名字里带，但是实际上属于RL，而且是IRL（逆强化学习）的一种，巧妙地将IL和RL进行了结合。逆强化学习IRL(Inverse Reinforcement Learning)则没有奖励，取而代之的是“环境互动+最大化从专家数据学到的奖励函数=最优Actor 逆GAIL(Generative Adversarial Imitation Learning)是使用GAN(Generative Adversarial Network)的IRL，即训练一个生成器GGG ，它从一个普通的分布逐渐生成与现有数据分布相似的分布。GAIL的数据集(参考运动)是{s,a}\{s, a\}{s,a}。同样，我们希望我们的 Actor 能够模仿专家，即 Actor 产生的轨迹（的分布）与专家产生的轨迹（的分布）相似。GAN中的生成器和判别器这里不再赘述。reward是鼓励policy的行为和数...

vim操作

发表于2025-01-15|Ubuntu

Vim 常用命令基本模式普通模式（Normal Mode）：默认模式，用于移动和命令插入模式（Insert Mode）：用于输入文本命令模式（Command Mode）：用于执行命令模式切换 i - 进入插入模式（在光标前插入） a - 进入插入模式（在光标后插入） o - 在下一行插入 O - 在上一行插入 Esc - 返回普通模式 : - 进入命令模式光标移动 w - 移动到下一个单词开头 b - 移动到上一个单词开头 0 - 移动到行首 $ - 移动到行尾 gg - 移动到文件开头 G - 移动到文件末尾 Ctrl+f - 向下翻页 Ctrl+b - 向上翻页编辑操作 dd - 删除当前行 D - 删除到行尾 yy - 复制当前行 yw - 复制当前单词 p - 粘贴 u - 撤销 Ctrl+r - 重做搜索和替换 /关键词 - 向下搜索 ?关键词 - 向上搜索 n - 下一个匹配 N - 上一个匹配 :%s/旧文本/新文本/g - 全文替换 :%s/旧文本/新文本/gc - 全文替换（确认）保存和退出 :w - 保存文件 :q - ...