Rayadurgam Srikant (University of Illinois Urbana-Champaign)
https://simons.berkeley.edu/talks/fou...
Data-Driven Decision Processes Boot Camp
This part of the tutorial will build upon the first part of the tutorial on MDPs and focus on reinforcement learning. We will present three algorithms: TD learning, Q-Learning and Natural Policy Gradient, and outline the key ideas behind obtaining finite-time performance bounds for each of these algorithms.
Смотрите видео Foundations of RL онлайн без регистрации, длительностью часов минут секунд в хорошем качестве. Это видео добавил пользователь Simons Institute 01 Январь 1970, не забудьте поделиться им ссылкой с друзьями и знакомыми, на нашем сайте его посмотрели 3,74 раз и оно понравилось 1 людям.