• Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
Чтение: Новый тест ставит ИИ-модели в тупик: люди справились лучше
Поделиться
Уведомление Показать больше
Font ResizerAa
Font ResizerAa
  • Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
Search
  • Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
У вас есть существующая учетная запись? Войти
Подписывайтесь на нас
Технологии

Новый тест ставит ИИ-модели в тупик: люди справились лучше

25.03.2025
2 мин. чтение

Contents
  • Что представляет собой тест ARC-AGI — 2?
  • Как прошли испытания?
  • Как улучшили тест?
  • Проблемы с вычислительными затратами
  • Как изменится подход к ИИ?

Новый тест ставит ИИ-модели в тупик: люди справились лучше

Большинство моделей ИИ не справились с новым тестом, но люди показали неплохие результаты.

Тест ARC-AGI — 2 для оценки интеллектуальных способностей ИИ-моделей продемонстрировал огромный разрыв между возможностями современных технологий и человеческим интеллектом, пишет 3D News. Модели, такие как o1-pro и R1, набрали не более 1,3%, в то время как люди показали результат в 60%.

Что представляет собой тест ARC-AGI — 2?

Фонд Arc Prize Foundation, который создал этот тест, разработал серию головоломок, в которых ИИ должен анализировать визуальные закономерности, решая задачи на основе разноцветных квадратов. В отличие от предыдущих тестов, ARC-AGI — 2 не позволяет моделям использовать прошлый опыт, заставляя их адаптироваться к новым задачам.

Как прошли испытания?

В тестировании участвовало более 400 человек, которые в среднем правильно ответили на 60% заданий. Это значительно превышает результаты ИИ, что подтверждает огромный разрыв в решении задач, требующих адаптации и понимания новых концепций.

Как улучшили тест?

Шолле, соучредитель Arc Prize Foundation, объяснил, что ARC-AGI — 2 является более точным индикатором реального интеллекта ИИ, чем предыдущий тест ARC-AGI — 1. В новой версии была исключена возможность решения задач с помощью «метода грубой силы», при котором ИИ использует огромные вычислительные мощности для перебора всех возможных вариантов. Для этого была введена метрика эффективности, которая вынуждает ИИ «на лету» интерпретировать паттерны, а не полагаться на запоминание.

Проблемы с вычислительными затратами

Тест ARC-AGI — 1 был основным в течение пяти лет, пока в декабре 2024 года OpenAI не представила модель o3, которая продемонстрировала достижения, сравнявшиеся с человеческим уровнем. Однако, как оказалось, эти результаты были достигнуты за счет значительных вычислительных затрат.

Как изменится подход к ИИ?

В ответ на растущие опасения о недостаточной объективности критериев для оценки ИИ, Arc Prize Foundation объявила о запуске конкурса Arc Prize 2025. Участники должны будут достичь 85% точности на ARC-AGI — 2, при этом не затратив более $0,42 на решение каждой задачи.

ЧИТАЙТЕ ТАКЖЕ:





ПОМЕЧЕНО:ИИ-моделилучшеНовыйсправилисьставиттупик
Комментариев нет Комментариев нет

Добавить комментарий Отменить ответ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

ЛУЧШИЕ НОВОСТИ


СВЕЖИЕ НОВОСТИ

Война мошенникам: госуслуги хотят отвязать от СМС-восстановления
Общество
Шаляпин рассказал, как лишился девственности с бабушкой друга
Шоу-бизнес
«МК»: Аналитик Шон Белл нашел нужным рассказать о причинах провала Зеленского
Политика
Наталия Антонова блеснула огромной грудью в прозрачной накидке
Шоу-бизнес
АБН24: Путину понравится подарок от Трампа на 9 Мая
Политика
В Подмосковье электричка столкнулась с такси, двое погибли
Политика
Foreign Policy: На саммите в Вильнюсе Украину не только не пригласят в НАТО, но и не обозначат конкретных сроков вступления
Политика
Агутин решил публично обратиться к Варум на фоне слухов о разводе
Общество
Может только Путин: какого шага президента боится элита, объяснил эксперт
Политика

Читайте также:

Технологии

Созданы «бессмертные» стволовые клетки для дешевого искусственного мяса

11.05.2023
Технологии

В Китае разработали батарейку с радиоактивным углеродом, которая проработает до 100 лет

15.03.2025
Технологии

В небе над США заметили загадочные зеленые лучи: откуда они появились

08.02.2023
Технологии

Почти 10 000 роутеров Asus тайно заразили: как проверить свой и защититься

30.05.2025
Подписывайтесь на нас
Welcome Back!

Sign in to your account

Username or Email Address
Password

Забыли пароль?