0%

强化学习分类

2020

Batch-Constrained deep Q-learning (BCQ)

04-07

Trust Region Path Consistency Learning (Trust-PCL)

04-04

Path Consistency Learning (PCL)

03-27

Soft Q-learning (SQL)

03-17

Twin Delayed Deep Deterministic policy gradient

03-09

Soft actor-critic

03-08

Generative Adversarial Imitation Learning

03-04

Hindsight Experience Replay

02-29

Reinforcement learning with unsupervised auxiliary tasks

02-25

ACKTR论文笔记

02-23