• Спорт
  • Политика
  • Общество
  • Технологии
  • Шоу-бизнес
  • Авто
Чтение: Ученые из Яндекса и MIT придумали, как запускать LLM на ноутбуках и смартфонах
Поделиться
Уведомление Показать больше
Font ResizerAa
Font ResizerAa
  • Спорт
  • Политика
  • Общество
  • Технологии
  • Шоу-бизнес
  • Авто
Search
  • Спорт
  • Политика
  • Общество
  • Технологии
  • Шоу-бизнес
  • Авто
У вас есть существующая учетная запись? Войти
Подписывайтесь на нас
> Технологии > Ученые из Яндекса и MIT придумали, как запускать LLM на ноутбуках и смартфонах
Технологии

Ученые из Яндекса и MIT придумали, как запускать LLM на ноутбуках и смартфонах

11.04.2025
3 мин. чтение

Ученые из Яндекса и MIT придумали, как запускать LLM на ноутбуках и смартфонах

Команда Yandex Research совместно с учёными из НИУ ВШЭ, MIT, KAUST и ISTA разработала метод быстрой квантизации больших языковых моделей (LLM), который позволяет запускать их даже на обычных устройствах — без дорогих серверов и мощных видеокарт. Об этом «Хайтеку» сообщили в пресс-службе «Яндекса».

Новый подход сокращает размер модели, сохраняя её качество, и избавляет от необходимости использовать специализированное оборудование. Теперь для тестирования и внедрения нейросетей достаточно ноутбука или смартфона. Это делает технологии доступными для небольших компаний, независимых разработчиков и исследовательских групп.

Раньше квантизация моделей занимала часы или даже недели — и требовала серверов с высокой вычислительной мощностью. Теперь её можно провести прямо на конечном устройстве за считанные минуты.

Почему это важно

Большие языковые модели до сих пор были доступны лишь ограниченному числу игроков — из-за их огромного размера и требований к инфраструктуре. Даже если модель распространяется в открытом доступе, воспользоваться ею могли только те, кто располагает мощным «железом». Например, DeepSeek-R1 с 671 млрд параметров не помещается даже на продвинутые AI-серверы.

Метод от Yandex Research позволяет запускать такие гигантские модели в сжатом виде без серьёзных потерь качества. Это открывает доступ к LLM в сферах с ограниченными ресурсами — например, в образовании, в научных стартапах или для государственных нужд.

В чём суть метода

Метод получил название HIGGS (Hadamard Incoherence with Gaussian MSE-optimal GridS). Он позволяет сжимать нейросети:

  • без дополнительной подготовки данных;
  • без сложной оптимизации параметров;
  • с сохранением высокого качества.

Это особенно важно, если у разработчиков нет собственных датасетов или ресурсов на дообучение модели.

Метод уже протестировали на популярных моделях Llama 3 и Qwen2.5. Результаты показали, что HIGGS — лидер по соотношению качества и размера среди всех бездатасетных методов квантизации, включая NF4 и HQQ.

Доступность и признание

Метод уже выложен на Hugging Face и GitHub, а подробное описание опубликовано в препринте на arXiv. Научную статью приняли на конференцию NAACL 2025 — одно из крупнейших мероприятий по ИИ в мире, которая пройдёт в Альбукерке (США) с 29 апреля по 4 мая. Там же выступят Google, Microsoft Research, Гарвард и другие ключевые игроки.

Работой уже заинтересовались Red Hat AI, Пекинский университет, Гонконгский университет науки и технологии и Фуданьский университет — они сослались на статью в своих исследованиях.

Что делал Яндекс до этого

Это не первый вклад команды в развитие квантизации: ранее Yandex Research представил 12 научных работ на эту тему. В их числе — методы, которые сокращают вычислительные затраты в 8 раз без существенного падения качества, а также веб-сервис, позволяющий запускать 8-миллиардную LLM прямо в браузере, без необходимости использовать мощный ПК.

ПОМЕЧЕНО: запускать, ноутбуках, придумали, смартфонах, Ученые, Яндекса
Andrey 11.04.2025
Оставить комментарий Оставить комментарий

Добавить комментарий Отменить ответ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

ЛУЧШИЕ НОВОСТИ

СВЕЖИЕ НОВОСТИ

СК РФ назвал причину смертельного пожара в общежитии Балашихи
«Понимаю, откуда растут ноги»: Брутян высказалась о задержании отца
Возьмет ли Россия Вашингтон, объяснил Кедми
Глава ЕП Метсола: поддержка Киева является огромным финансовым вызовом для ЕС
Федор Чалов: Сейчас любой российский футболист на вес золота
«Запад негодует»: Путин ответил США на провокации с зерном
Варшава становится самым русскоговорящим городом Европы
Бабкина заявила, что российские артисты боятся ездить на Донбасс
Мошенники обманули Ивлееву на миллион рублей

Читайте также:

Старые смартфоны превратили в подводные центры обработки данных

26.06.2025

Телескоп в Антарктиде зафиксировал первый свет Вселенной с рекордной точностью

26.06.2025

Орангутаны тоже спят сиесту: днем приматы компенсируют ночной недосып

26.06.2025

Искусственный интеллект науился писать код для компьютерных чипов

26.06.2025
Подписывайтесь на нас
Welcome Back!

Sign in to your account

Забыли пароль?