Sciweavers

Free Online Productivity Tools i2Speak i2Symbol i2OCR iTex2Img iWeb2Print iWeb2Shot i2Type iPdf2Split iPdf2Merge i2Bopomofo i2Arabic i2Style i2Image i2PDF iLatex2Rtf Sci2ools

15

ICML
2006
IEEE

favoriteEmaildiscussreport

144views Machine Learning» more ICML 2006»

Probabilistic inference for solving discrete and continuous state Markov Decision Processes

14 years 5 months ago

Probabilistic inference for solving discrete and continuous state Markov Decision Processes

Download eprints.pascal-network.org

Inference in Markov Decision Processes has recently received interest as a means to infer goals of an observed action, policy recognition, and also as a tool to compute policies. A particularly interesting aspect of the approach is that any existing inference technique in DBNs now becomes available for answering behavioral questions?including those on continuous, factorial, or hierarchical state representations. Here we present an Expectation Maximization algorithm for computing optimal policies. Unlike previous approaches we can show that this actually optimizes the discounted expected future return for arbitrary reward functions and without assuming an ad hoc finite total time. The algorithm is generic in that any inference technique can be utilized in the E-step. We demonstrate this for exact inference on a discrete maze and Gaussian belief state propagation in continuous stochastic optimal control problems.

Marc Toussaint, Amos J. Storkey

Real-time Traffic

Exact Inference | Expectation Maximization Algorithm | ICML 2006 | Inference Technique | Machine Learning |

claim paper

Related Content

» Heuristic Refinements of Approximate Linear Programming for Factored ContinuousState Marko...

» Solving Decentralized Continuous Markov Decision Problems with Structured Reward

» Solving Factored MDPs with Continuous and Discrete Variables

» Solving Factored MDPs with Hybrid State and Action Variables

» Mean field for Markov Decision Processes from Discrete to Continuous Optimization

» Linear Program Approximations for Factored ContinuousState Markov Decision Processes

» Bayesian reinforcement learning in continuous POMDPs with gaussian processes

» SampleBased Planning for Continuous Action Markov Decision Processes

» A Fast Analytical Algorithm for Solving Markov Decision Processes with RealValued Resource...

Post Info
More Details (n/a)

Added	17 Nov 2009
Updated	17 Nov 2009
Type	Conference
Year	2006
Where	ICML
Authors	Marc Toussaint, Amos J. Storkey

Comments (0)