Thompson sampling, one armed bandits, and the Beta distribution

Опубликовано: 06 Июль 2021
на канале: Serrano.Academy
22,996
920

Thompson sampling is a strategy to explore a space while exploiting the wins. In this video we see an application to winning at a game of one-armed bandits.

Beta distributions video:    • The Beta distribution in 12 minutes!  

Tom Denton blog: https://inventingsituations.net/

Icons made by Freepik from https://www.flaticon.com

Announcement: Book by Luis Serrano! Grokking Machine Learning. bit.ly/grokkingML
40% discount code: serranoyt


Смотрите видео Thompson sampling, one armed bandits, and the Beta distribution онлайн без регистрации, длительностью часов минут секунд в хорошем качестве. Это видео добавил пользователь Serrano.Academy 06 Июль 2021, не забудьте поделиться им ссылкой с друзьями и знакомыми, на нашем сайте его посмотрели 22,99 раз и оно понравилось 92 людям.