blog写作
markdown的写作 标题 # 一级标题 ## 二级标题 ... 引用 1. 直接tab 使用> + 空格 列举 1. *,等 a b 2. 数字 a b 代码 使用``` 1# include 1import
Ubuntu操作
Ubuntu的操作 文件操作 查看文件大小 系统操作
frp穿透
SakuraFrp内网穿透教程 远程管理 本工具可用于家中电脑远程管理、内网linux服务器SSH映射、监控管理、本地电脑建站等。 官网地址 https://www.natfrp.com/ 注册账号 登入SarkuraFrp管理界面 创建隧道 下载Frp客户端
amp
AMP: Adversarial Motion Priors for Stylized Physics-Based Character Control 项目地址: 代码地址: 方法 本论文采用了GAIL算法,虽然名字里带,但是实际上属于RL,而且是IRL(逆强化学习)的一种,巧妙地将IL和RL进行了结合。 逆强化学习IRL(Inverse Reinforcement Learning)则没有奖励,取而代之的是“环境互动+最大化从专家数据学到的奖励函数=最优Actor 逆GAIL(Generative Adversarial Imitation Learning)是使用GAN(Generative Adversarial Network)的IRL,即训练一个生成器GGG ,它从一个普通的分布逐渐生成与现有数据分布相似的分布。GAIL的数据集(参考运动)是{s,a}\{s, a\}{s,a}。同样,我们希望我们的 Actor 能够模仿专家,即 Actor 产生的轨迹(的分布)与专家产生的轨迹(的分布)相似。GAN中的生成器和判别器这里不再赘述。reward是鼓励policy的行为和数...