How a Better Dataset Creates a New SOTA Model!

Опубликовано: 08 Октябрь 2023
на канале: Boris Meinardus
474
13

“MMICL: Empowering Vision-Language Model with Multi-Modal In-Context Learning” paper explained

Multi-Modal Large Language Models are the natural next step for LLMs and in this video, we'll look at one of the new state-of-the-art models.
Based on BLIP-2, MMICL enables interleaved image and text sequences as input. But its strongest advantage is its newly curated MIC dataset!

⬇️ Follow me on my other socials and feel free to DM questions! ⬇️
⚫⚪ Medium:   / boris.meinardus  
🐦 Twitter:   / borismeinardus  

================== Timestamps ================
00:00 - Intro
00:25 - Visual Results
01:25 - Model Architecture
02:39 - Model Training
04:49 - The MIC Dataset
06:43 - Evaluation Results
09:33 - Conclusion
=============================================

#ai #research #llm


Смотрите видео How a Better Dataset Creates a New SOTA Model! онлайн без регистрации, длительностью часов минут секунд в хорошем качестве. Это видео добавил пользователь Boris Meinardus 08 Октябрь 2023, не забудьте поделиться им ссылкой с друзьями и знакомыми, на нашем сайте его посмотрели 474 раз и оно понравилось 13 людям.