Sample-Based Planning for Continuous Action Markov Decision Processes

14 years 7 months ago

Download www.chrismansley.com

In this paper, we present a new algorithm that integrates recent advances in solving continuous bandit problems with sample-based rollout methods for planning in Markov Decision Processes (MDPs). Our algorithm, Hierarchical Optimistic Optimization applied to Trees (HOOT) addresses planning in continuous-action MDPs. Empirical results are given that show that the performance of our algorithm meets or exceeds that of a similar discrete action planner by eliminating the problem of manual discretization of the action space.

Christopher R. Mansley, Ari Weinstein, Michael L.

Real-time Traffic

Action Planner | AIPS 2011 | Artificial Intelligence | Bandit Problems | Markov Decision Processes |

claim paper

» Planning with continuous resources for agent teams

» HiPPo Hierarchical POMDPs for Planning Information Processing and Sensing Actions on a Rob...

» Probabilistic inference for solving discrete and continuous state Markov Decision Processe...

» Building efficient partial plans using Markov decision processes

» Coarticulation an approach for generating concurrent plans in Markov decision processes

» Solving Factored MDPs with Continuous and Discrete Variables

» Using Rewards for Belief State Updates in Partially Observable Markov Decision Processes

» Oracular Partially Observable Markov Decision Processes A Very Special Case

Post Info
More Details (n/a)

Added	24 Aug 2011
Updated	24 Aug 2011
Type	Journal
Year	2011
Where	AIPS
Authors	Christopher R. Mansley, Ari Weinstein, Michael L. Littman

Comments (0)

Sciweavers

Sample-Based Planning for Continuous Action Markov Decision Processes

Action Planner | AIPS 2011 | Artificial Intelligence | Bandit Problems | Markov Decision Processes |

Explore & Download

Productivity Tools

Sciweavers