Foundations of RL

Опубликовано: 01 Январь 1970
на канале: Simons Institute
3,744
15

Rayadurgam Srikant (University of Illinois Urbana-Champaign)
https://simons.berkeley.edu/talks/fou...
Data-Driven Decision Processes Boot Camp

This part of the tutorial will build upon the first part of the tutorial on MDPs and focus on reinforcement learning. We will present three algorithms: TD learning, Q-Learning and Natural Policy Gradient, and outline the key ideas behind obtaining finite-time performance bounds for each of these algorithms.


Смотрите видео Foundations of RL онлайн без регистрации, длительностью часов минут секунд в хорошем качестве. Это видео добавил пользователь Simons Institute 01 Январь 1970, не забудьте поделиться им ссылкой с друзьями и знакомыми, на нашем сайте его посмотрели 3,74 раз и оно понравилось 1 людям.