• Спорт
  • Политика
  • Общество
  • Технологии
  • Шоу-бизнес
  • Авто
Чтение: DeepSeek выпустила улучшенную версию DeepSeek-V3: она работает даже на Mac Studio
Поделиться
Уведомление Показать больше
Font ResizerAa
Font ResizerAa
  • Спорт
  • Политика
  • Общество
  • Технологии
  • Шоу-бизнес
  • Авто
Search
  • Спорт
  • Политика
  • Общество
  • Технологии
  • Шоу-бизнес
  • Авто
У вас есть существующая учетная запись? Войти
Подписывайтесь на нас
> Технологии > DeepSeek выпустила улучшенную версию DeepSeek-V3: она работает даже на Mac Studio
Технологии

DeepSeek выпустила улучшенную версию DeepSeek-V3: она работает даже на Mac Studio

25.03.2025
2 мин. чтение

DeepSeek выпустила улучшенную версию DeepSeek-V3: она работает даже на Mac Studio

Китайская компания DeepSeek выпустила обновленную версию своей большой языковой модели DeepSeek-V3. По данным компании, новая версия превосходит предыдущую в нескольких бенчмарках, а также демонстрирует улучшенную производительность.

По данным разработчиков, модель демонстрирует лучшую производительность в ряде бенчмарков и отличается эффективным использованием ресурсов. Одновременно компания объявила о переходе на лицензию MIT, которая позволяет использовать модель без ограничений, в том числе в коммерческих проектах.

DeepSeek выпустила улучшенную версию DeepSeek-V3: она работает даже на Mac Studio

Сравнение моделей. Источник: DeepSeek
Особенность новой версии DeepSeek-V3 — архитектура с выборочной активацией параметров. При общем объеме в 671 млрд параметров модель использует в работе лишь около 37 млрд, что резко снижает требования к инфраструктуре. Кроме того, применяется четырехбитное квантование, позволяющее экономить память почти без потери качества.

По словам научного сотрудника Apple Авни Ханнуна, ему удалось запустить DeepSeek-V3 локально на Mac Studio, где она работала со скоростью около 20 токенов в секунду. Это делает модель одной из самых производительных в своем классе, учитывая масштабы и аппаратные ограничения.

The new Deep Seek V3 0324 in 4-bit runs at > 20 toks/sec on a 512GB M3 Ultra with mlx-lm! pic.twitter.com/wFVrFCxGS6
— Awni Hannun (@awnihannun) March 24, 2025
Разработчики отмечают рост эффективности модели в задачах программирования. По их данным, в сравнении с предыдущей версией точность выполнения подобных задач выросла на несколько процентных пунктов, хотя DeepSeek-V3 пока уступает узкоспециализированным инструментам.

В начале года DeepSeek вызвала резонанс на ИИ-рынке заявлением о рекордно низкой стоимости обучения модели — $6 млн. Это на два порядка ниже, чем у большинства конкурентов. Заявление вызвало волну обсуждений и даже кратковременное падение акций ведущих технологических компаний США.

Позже аналитики уточнили, что DeepSeek указывала только затраты на активное время работы GPU, не включая инфраструктуру, зарплаты, хранение данных и закупку оборудования. По данным SemiAnalysis, реальные затраты на обучение модели могли составить сотни миллионов долларов, что всё ещё ниже, чем у крупных игроков, но не столь революционно, как было заявлено.

ПОМЕЧЕНО: DeepSeek, DeepSeek-V3, Studio, версию, выпустила, работает, улучшенную
Pasha 25.03.2025
Оставить комментарий Оставить комментарий

Добавить комментарий Отменить ответ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

ЛУЧШИЕ НОВОСТИ

СВЕЖИЕ НОВОСТИ

До вымирания человечества по версии Эйнштейна осталось 14 лет
Послание инопланетян или мусор: ученые спорят о природе сферул со дна океана
В России придумали, как искать телефонных мошенников по голосу
Власти Чебоксар отменили концерт фронтмена рок-группы «Ночные снайперы» Арьениной из-за отношения к СВО
Как София Ротару помогла внуку бежать за границу: подробности
В США арестовали учительницу за совращение ученика
Экономист Щербаченко: проценты по потребкредитам вырастут до 50% в 2025 году
Песков усомнился в роли Маска в урегулировании конфликта между Россией и США
В Польше допустили возможность сбивать ракеты ВС РФ над Украиной

Читайте также:

Посмотрите на редкое фото Сатурна: это затмение не увидеть еще 15 лет

27.06.2025

Старые смартфоны превратили в подводные центры обработки данных

26.06.2025

Телескоп в Антарктиде зафиксировал первый свет Вселенной с рекордной точностью

26.06.2025

Орангутаны тоже спят сиесту: днем приматы компенсируют ночной недосып

26.06.2025
Подписывайтесь на нас
Welcome Back!

Sign in to your account

Забыли пароль?