• Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
Чтение: В Apple усомнились в способности существующих моделей ИИ рассуждать
Поделиться
Уведомление Показать больше
Font ResizerAa
Font ResizerAa
  • Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
Search
  • Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
У вас есть существующая учетная запись? Войти
Подписывайтесь на нас
Технологии

В Apple усомнились в способности существующих моделей ИИ рассуждать

11.06.2025
3 мин. чтение

В Apple усомнились в способности существующих моделей ИИ рассуждать

Apple поставила под сомнение способность ведущих моделей ИИ к логическим рассуждениям. В исследовании, опубликованном на сайте Apple’s Machine Learning Research, тестировались модели OpenAI, DeepSeek, Anthropic и Google. Результаты оказались неожиданными: при решении сложных задач точность этих систем резко падала.

В эксперименте проверили o1 и o3 от OpenAI, R1 от DeepSeek, Claude 3.7 Sonnet от Anthropic и Gemini от Google. Каждой из моделей предлагались четыре классические логические задачи: переправа через реку, прыжки через шашки, укладка блоков и башня Ханоя.

Результаты оказались неожиданными. В простых задачах продвинутые модели со способностью к рассуждениям уступали обычным большим языковым моделям. В задачах средней сложности — превосходили их, а при переходе к действительно сложным головоломкам точность стремилась практически к нулю.

Даже при предоставлении пошаговых алгоритмов решения, например, для башни Ханоя, качество не улучшалось. Более того, модели вели себя непоследовательно: могли сделать до 100 правильных ходов в одной задаче, но проваливали первые пять — в другой.

Анализ показал, что по мере роста сложности модели начинали использовать меньше токенов, то есть «размышляли» меньше, чем раньше, даже при наличии ресурсов. Это указывает на фундаментальные ограничения в поддержании цепочки рассуждений.

Рассуждающие модели работают по принципу «цепочки мыслей»: они имитируют человеческую логику, разбивая сложные задачи на множество шагов и объясняя свои действия на каждом этапе. Однако исследователи Apple полагают, что этот подход основан не на «понимании», а на узнавании шаблонов из обучающих данных.

Apple также критикует принятые подходы к оценке ИИ: по их мнению, существующие бенчмарки часто включают задачи, встречающиеся в обучающих выборках, что искажает реальную картину.

Работа вызвала неоднозначную реакцию. Одни считают, что Apple, отстающая в гонке ИИ, таким образом подрывает доверие к конкурентам. Другие — поддерживают.

Например, эксперт по машинному обучению и бывший руководитель группы в Gartner Андрей Бурков в посте в X назвал исследование важным вкладом в понимание возможностей ИИ. Он подчеркнул, что даже самые продвинутые модели остаются нейросетями — со всеми их ограничениями.

Apple did more for AI than anyone else: they proved through peer-reviewed publications that LLMs are just neural networks and, as such, have all the limitations of other neural networks trained in a supervised way, which I and a few other voices tried to convey, but the noise…
— Andriy Burkov (@burkov) June 9, 2025

ЧИТАЙТЕ ТАКЖЕ:





ПОМЕЧЕНО:Appleмоделейрассуждатьспособностисуществующихусомнились
Комментариев нет Комментариев нет

Добавить комментарий Отменить ответ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

ЛУЧШИЕ НОВОСТИ


СВЕЖИЕ НОВОСТИ

Черная смерть бушевала в Африке за тысячу лет до Европы, показал анализ мумии
Технологии
Японию выдавят с рынка: в Китае откроются автоаукционы
Авто
Деньги «сгорят»: что нужно срочно сделать всем россиянам с банковскими вкладами
Общество
Посмотрите, как Земля закрывает Солнце: Blue Ghost прислал кадры из космоса
Технологии
Звезде «Аншлага» потребовалась помощь врачей
Шоу-бизнес
Украину продали частной компании «Black Rock» — эксперт
Политика
Ночью Москва послала огненный привет Парижу и Лондону
Политика
Алибасов публично унизил Садальского за его слова про отравление
Шоу-бизнес
Мошенники нацелились на студентов, школьников и их родителей в преддверии 1 сентября
Общество

Читайте также:

Технологии

Мамонты не всегда были такими, как думали люди

08.04.2023
Технологии

Алгоритм ученых из России и Китая ускорил расчеты на Nvidia в 800 раз: как им удалось

30.01.2025
Технологии

Четвертому пациенту пересадили модифицированную почку свиньи

13.02.2025
Технологии

Сегодня стартует пилотируемый «Союз»: где смотреть трансляцию

11.09.2024
Подписывайтесь на нас
Welcome Back!

Sign in to your account

Username or Email Address
Password

Забыли пароль?