В Яндексе придумали новый способ сжатия нейросетей

Учёные Яндекса разработали и опубликовали в свободном доступе новые методы сжатия больших языковых моделей. По мнению специалистов Yandex Research, они позволят бизнесу сократить расходы на вычислительные ресурсы до восьми раз. Разработка будет полезна корпорациям, стартапам и исследователям, которые запускают нейросети на своём оборудовании.

Чтобы большая языковая модель отвечала качественно и быстро, требуется множество дорогостоящих мощных графических процессоров. Решение Яндекса позволяет уменьшить модель в несколько раз, сократить количество необходимых процессоров и запустить её на устройствах с меньшей вычислительной мощностью. А значит внедрение нейросетей и обслуживание оборудования станет дешевле для бизнеса.

Решение Яндекса включает в себя два инструмента. Первый позволяет получить уменьшенную до восьми раз нейросеть, которая быстрее работает и может быть запущена, например, на одном графическом процессоре вместо четырёх. Второй инструмент исправляет ошибки, которые возникают в процессе сжатия большой языковой модели.

Качество ответов оригинальной и сжатой версии нейросети сравнивали на англоязычных бенчмарках. Новый подход показал лучший результат среди всех существующих методов сжатия, отмечают в Яндексе. Метод, созданный в Yandex Research, сохраняет в среднем 95% качества ответов нейросети, а другие популярные инструменты сохраняют для тех же моделей лишь 59% — 90% качества. Код нового метода опубликован на GitHub, также можно скачать уже сжатые с его помощью популярные модели с открытым исходным кодом и обучающие материалы.

Источник: industry-hunter.com

Tags: Электроника

В Яндексе придумали новый способ сжатия нейросетей

Группа компаний «Элемент» привлекает кредит на 15 млрд рублей от ВЭБ.РФ

Китайцы сделали первый ИИ-чип для автомобилей по техпроцессу 5 нм. Nio представила процессор Shenji NX9031

X-Bow Systems успешно испытала крупнейший в мире твердотопливный ракетный двигатель

Группа компаний «Элемент» привлекает кредит на 15 млрд рублей от ВЭБ.РФ

Китайцы сделали первый ИИ-чип для автомобилей по техпроцессу 5 нм. Nio представила процессор Shenji NX9031

X-Bow Systems успешно испытала крупнейший в мире твердотопливный ракетный двигатель

Обратный эффект антикитайских санкций США. Китайцы выкатили 6-нанометровый 12-ядерный процессор Cixin P1 для ПК с ИИ

В Мордовии работают над уникальной стеклокерамикой для атомных станций

В Зеленограде запущено производство отечественного материала для 3D-печати

Около 80% владельцев PlayStation 4 никогда не играли в Uncharted

В России зафиксировали рост продаж игровых консолей за первую половину 2024 года

Названы самые популярные игровые аксессуары за первую половину 2024 года в России

Безопасный метод синтеза материалов для накопителей энергии и опреснителей воды разработали в России

Группа компаний «Элемент» привлекает кредит на 15 млрд рублей от ВЭБ.РФ

Китайцы сделали первый ИИ-чип для автомобилей по техпроцессу 5 нм. Nio представила процессор Shenji NX9031

В Мордовии работают над уникальной стеклокерамикой для атомных станций

Всадник из Гнездилова: новые исследования древнерусских погребений под Суздалем

Похожие записи:

Возможно, вы пропустили