Sciweavers

Free Online Productivity Tools i2Speak i2Symbol i2OCR iTex2Img iWeb2Print iWeb2Shot i2Type iPdf2Split iPdf2Merge i2Bopomofo i2Arabic i2Style i2Image i2PDF iLatex2Rtf Sci2ools

152

CDC
2009
IEEE

133views Control Systems» more CDC 2009»

Arbitrarily modulated Markov decision processes

15 years 10 months ago

Arbitrarily modulated Markov decision processes

Download www.cim.mcgill.ca

— We consider decision-making problems in Markov decision processes where both the rewards and the transition probabilities vary in an arbitrary (e.g., nonstationary) fashion. We propose an online Q-learning style algorithm and give a guarantee on its performance evaluated in retrospect against alternative policies. Unlike previous works, the guarantee depends critically on the variability of the uncertainty in the transition probabilities, but holds regardless of arbitrary changes in rewards and transition probabilities over time. Besides its intrinsic computational efﬁciency, this approach requires neither prior knowledge nor estimation of the transition probabilities.

Jia Yuan Yu, Shie Mannor

Real-time Traffic

CDC 2009 | Control Systems | Markov Decision | Q-learning Style Algorithm | Transition Probabilities |

claim paper

Related Content

» Markov Decision Processes with Arbitrary Reward Processes

» A Sparse Sampling Algorithm for NearOptimal Planning in Large Markov Decision Processes

» Partially Observable Markov Decision Process POMDP Technologies for Sign Language Based Hu...

» An Incremental Samplingbased Algorithm for Stochastic Optimal Control

» CrossLayer Design of Optimal Adaptation Technique over SelectionCombining Diversity Nakaga...

» Optimal Wavelength Sharing Policies in OBS Networks Subject to QoS Constraints

» Approximate abstractions of discretetime controlled stochastic hybrid systems

» CrossLayer Rate and Power Adaptation Strategies for IRHARQ Systems over Fading Channels wi...

» Policy teaching through reward function learning

Post Info
More Details (n/a)

Added	21 Jul 2010
Updated	21 Jul 2010
Type	Conference
Year	2009
Where	CDC
Authors	Jia Yuan Yu, Shie Mannor

Comments (0)