PingPong - Benchmark for Role-Playing LLMs

Опубликовано: 21 Август 2024
на канале: Fahd Mirza
223
16

This video introduces PingPong benchmark for RP AI models and it uses LLM-as-a-Judge which is an evaluation method that relies on solid LLMs such as GPT-4 instead of humans. In this benchmark, we rely on LLMs not only to judge the answer but also to ask the questions.

🔥 Buy Me a Coffee to support the channel: https://ko-fi.com/fahdmirza

🔥 Get 50% Discount on any A6000 or A5000 GPU rental, use following link and coupon:

https://bit.ly/fahd-mirza
Coupon code: FahdMirza

▶ Become a Patron 🔥 -   / fahdmirza  

#pingpong #llmasajudge

PLEASE FOLLOW ME:
▶ LinkedIn:   / fahdmirza  
▶ YouTube:    / @fahdmirza  
▶ Blog: https://www.fahdmirza.com

RELATED VIDEOS:

▶ Resource https://ilyagusev.github.io/ping_pong...

All rights reserved © Fahd Mirza


Смотрите видео PingPong - Benchmark for Role-Playing LLMs онлайн без регистрации, длительностью часов минут секунд в хорошем качестве. Это видео добавил пользователь Fahd Mirza 21 Август 2024, не забудьте поделиться им ссылкой с друзьями и знакомыми, на нашем сайте его посмотрели 22 раз и оно понравилось 1 людям.