uncategorized

Automatic construction of temporally extended actions for MDPs using bisimulation metrics

Between MDPs and semi-MDPs: A framework for temporal abstraction in reinforcement learning

Binary action search for learning continuous-action control policies

UTree algorithm (McCallum 1995)

Controlled Markov Process (CMP) homomorphisms

MDP homomorphism (Ravindran 2004)

Macro-actions, model MDPs at multiple time scales (old materials):

Hierachical solution of Markov Decision Processes using macro-actions

Z's learning note

Explorer

uncategorized

Automatic construction of temporally extended actions for MDPs using bisimulation metrics

Between MDPs and semi-MDPs: A framework for temporal abstraction in reinforcement learning

Binary action search for learning continuous-action control policies

UTree algorithm (McCallum 1995)

Controlled Markov Process (CMP) homomorphisms

MDP homomorphism (Ravindran 2004)

Macro-actions, model MDPs at multiple time scales (old materials):

Hierachical solution of Markov Decision Processes using macro-actions

Z's learning note

Explorer

uncategorized

Automatic construction of temporally extended actions for MDPs using bisimulation metrics §

Between MDPs and semi-MDPs: A framework for temporal abstraction in reinforcement learning §

Binary action search for learning continuous-action control policies §

UTree algorithm (McCallum 1995) §

Controlled Markov Process (CMP) homomorphisms §

MDP homomorphism (Ravindran 2004) §

Macro-actions, model MDPs at multiple time scales (old materials): §

Hierachical solution of Markov Decision Processes using macro-actions §

Automatic construction of temporally extended actions for MDPs using bisimulation metrics

Between MDPs and semi-MDPs: A framework for temporal abstraction in reinforcement learning

Binary action search for learning continuous-action control policies

UTree algorithm (McCallum 1995)

Controlled Markov Process (CMP) homomorphisms

MDP homomorphism (Ravindran 2004)

Macro-actions, model MDPs at multiple time scales (old materials):

Hierachical solution of Markov Decision Processes using macro-actions