Квантизация и Llama 3.2 на мобилках. Post-Training квантизация SpinQuant

Published: 02 November 2024
on channel: Ruslan Dev
1,077
59

Подписывайтесь на Телеграм-канал: https://t.me/ruslandevlive

Это видео о квантизации Llama 3.2 и ее оптимизации под мобильные устройства, а также о новом методе post-training квантизации SpinQuant.

💻 immers.cloud – широкий выбор карт для обучения и инференса нейронных сетей: https://immers.cloud/signup/r/2024042...
Один из ведущих поставщиков услуг IaaS (Infrastructure as a Service) в России, специализирующийся на использовании графических процессоров (GPU).
Сервис предлагает конкурентоспособные цены и интуитивно понятный интерфейс, который даже начинающие пользователи могут легко освоить и начать работу с необходимым программным обеспечением.

💻 gptchain – фреймворк для быстрого развертывания AI-ассистентов: https://github.com/RuslanPeresy/gptchain
Поддерживает интеграцию с Telegram-ботом, Retrieval Augmented Generation (RAG), деплой моделей на LLM сервер и файнтюнинг LLM на собственных данных.

Дискорд:   / discord  

Это описание содержит реферальные ссылки.


Watch video Квантизация и Llama 3.2 на мобилках. Post-Training квантизация SpinQuant online without registration, duration hours minute second in high quality. This video was added by user Ruslan Dev 02 November 2024, don't forget to share it with your friends and acquaintances, it has been viewed on our site 1,07 once and liked it 5 people.