Institute of Information Theory and Automation

You are here

Bibliography

Conference Paper (international conference)

Optimal solutions for undiscounted variance penalized Markov decision chains

Sladký Karel, Sitař M.

: Dynamic Stochastic Optimization, p. 43-66

: IFIP/IIASA/GAMM Workshop on Dynamic Stochastic Optimization, (Laxenburg, AT, 11.03.2002-14.03.2002)

: CEZ:AV0Z1075907

: GA402/02/1015, GA ČR, GA402/01/0539, GA ČR

: Markov decision processes, optimal policies, mean-variance

(eng): We investigate how the minimum variance criterion can work in discrete stochastic dynamic programmig. We adapt notions and notation used in Markov decision processes and in contrast to the classical models we also considered variance of the obtained total reward. Various mean-variance optimality criteria are discussed and an algorithmical procedure for finding optimal policies is suggested. An illustrative numerical example is supplied.

(cze): V práci se studují vlastnosti kritérií optimality pro úlohy diskrétního stochastického dynamického programování zahrnující též rozptyl celkového výnosu. Jsou vyšetřovány různé varianty kritérií optimality typu průměrný výnos a jeho rozptyl a jsou navrženy algoritmické postupy pro nalezení optimálních řízení vzhledem k uvažovaným kritériím. Práce je doplněna ilustrativním numerickým příkladem

: 12B, 05D

: BC

2019-01-07 08:39