Подписывайтесь на Телеграм-канал: https://t.me/ruslandevlive
Это видео о квантизации Llama 3.2 и ее оптимизации под мобильные устройства, а также о новом методе post-training квантизации SpinQuant.
💻 immers.cloud – широкий выбор карт для обучения и инференса нейронных сетей: https://immers.cloud/signup/r/2024042...
Один из ведущих поставщиков услуг IaaS (Infrastructure as a Service) в России, специализирующийся на использовании графических процессоров (GPU).
Сервис предлагает конкурентоспособные цены и интуитивно понятный интерфейс, который даже начинающие пользователи могут легко освоить и начать работу с необходимым программным обеспечением.
💻 gptchain – фреймворк для быстрого развертывания AI-ассистентов: https://github.com/RuslanPeresy/gptchain
Поддерживает интеграцию с Telegram-ботом, Retrieval Augmented Generation (RAG), деплой моделей на LLM сервер и файнтюнинг LLM на собственных данных.
Дискорд: / discord
Это описание содержит реферальные ссылки.
Смотрите видео Квантизация и Llama 3.2 на мобилках. Post-Training квантизация SpinQuant онлайн без регистрации, длительностью часов минут секунд в хорошем качестве. Это видео добавил пользователь Ruslan Dev 02 Ноябрь 2024, не забудьте поделиться им ссылкой с друзьями и знакомыми, на нашем сайте его посмотрели 1,07 раз и оно понравилось 5 людям.