Как я обучил модель, которая понимает русский лучше GPT-3.5 Turbo | файнтюнинг Llama 3

Published: 02 July 2024
on channel: Ruslan Dev
2,462
172

Моя последняя модель обошла GPT-3.5-turbo на русскоязычном MT-Bench.

Для ее обучения я, как и обещал в прошлом видео, расширил свой датасет ответов GPT-4o русскоязычной выборкой из 8K примеров, итого получилось 10K (есть еще примеры на англ и китайском).

В качестве базовой модели я взял в этот раз оригинальную meta-llama/Meta-Llama-3-8B-Instruct.

Модель: https://huggingface.co/ruslandev/llam...
GGUF: https://huggingface.co/ruslandev/llam...
Датасет: https://huggingface.co/datasets/rusla...

Установка gptchain и консольные команды для файнтюнинга - https://vk.com/@immers.cloud-faintuni...
Бенчмарк MT-Bench - https://vk.com/@immers.cloud-benchmar...

💻 immers.cloud – широкий выбор карт для обучения и инференса нейронных сетей: https://immers.cloud/signup/r/2024042...
Один из ведущих поставщиков услуг IaaS (Infrastructure as a Service) в России, специализирующийся на использовании графических процессоров (GPU).
Сервис предлагает конкурентоспособные цены и интуитивно понятный интерфейс, который даже начинающие пользователи могут легко освоить и начать работу с необходимым программным обеспечением.

💻 gptchain – фреймворк для быстрого развертывания AI-ассистентов: https://github.com/RuslanPeresy/gptchain
Поддерживает интеграцию с Telegram-ботом, Retrieval Augmented Generation (RAG), деплой моделей на LLM сервер и файнтюнинг LLM на собственных данных.

Телеграм-канал: https://t.me/ruslandevlive
Дискорд:   / discord  

Это описание содержит реферальные ссылки.


Watch video Как я обучил модель, которая понимает русский лучше GPT-3.5 Turbo | файнтюнинг Llama 3 online without registration, duration hours minute second in high quality. This video was added by user Ruslan Dev 02 July 2024, don't forget to share it with your friends and acquaintances, it has been viewed on our site 2,462 once and liked it 172 people.