刘骞的博客

发表于2025-12-15|blog

markdown的写作标题 # 一级标题 ## 二级标题 ... 引用 1. 直接tab 使用> + 空格列举 1. *，等 a b 2. 数字 a b 代码使用``` 1# include 1import

发表于2025-12-15|Ubuntu

Ubuntu的操作文件操作查看文件大小系统操作

发表于2025-11-20|穿透

SakuraFrp内网穿透教程远程管理本工具可用于家中电脑远程管理、内网linux服务器SSH映射、监控管理、本地电脑建站等。官网地址 https://www.natfrp.com/ 注册账号登入SarkuraFrp管理界面创建隧道下载Frp客户端

amp

发表于2025-11-19|locomoion

AMP: Adversarial Motion Priors for Stylized Physics-Based Character Control 项目地址：代码地址：方法本论文采用了GAIL算法，虽然名字里带，但是实际上属于RL，而且是IRL（逆强化学习）的一种，巧妙地将IL和RL进行了结合。逆强化学习IRL(Inverse Reinforcement Learning)则没有奖励，取而代之的是“环境互动+最大化从专家数据学到的奖励函数=最优Actor 逆GAIL(Generative Adversarial Imitation Learning)是使用GAN(Generative Adversarial Network)的IRL，即训练一个生成器GGG ，它从一个普通的分布逐渐生成与现有数据分布相似的分布。GAIL的数据集(参考运动)是{s,a}\{s, a\}{s,a}。同样，我们希望我们的 Actor 能够模仿专家，即 Actor 产生的轨迹（的分布）与专家产生的轨迹（的分布）相似。GAN中的生成器和判别器这里不再赘述。reward是鼓励policy的行为和数...