• Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
Чтение: OpenAI: новая модель GPT обошла в тестах большинство программистов планеты
Поделиться
Уведомление Показать больше
Font ResizerAa
Font ResizerAa
  • Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
Search
  • Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
У вас есть существующая учетная запись? Войти
Подписывайтесь на нас
Технологии

OpenAI: новая модель GPT обошла в тестах большинство программистов планеты

23.12.2024
2 мин. чтение

OpenAI: новая модель GPT обошла в тестах большинство программистов планеты

Компания OpenAI представила o3 — новое семейство языковых моделей, но пока они будут доступны только исследователям для тестирования.

OpenAI разработала обновленные версии больших языковых моделей, способных к рассуждениям. Новая модель OpenAI под названием o3 заменяет o1, которую компания представила в сентябре. Как и o1, новая модель тратит время на размышления над проблемой, чтобы предоставить лучшие ответы на вопросы, требующие пошагового логического обоснования.

По словам OpenAI, модель o3 набрала по нескольким показателям и бенчмаркам, которые используют для оценки ИИ, больше баллов, чем ее предшественница. Среди этих тестов те, которые измеряют сложные навыки, связанные с программированием, а также сложные математические задачи и решение научных проблем.

Модель o3 обучена с помощью обучения с подкреплением «думать», прежде чем реагировать. Получив вопрос, o3 делает паузу перед ответом, «анализирует» информацию и «объясняет» свои рассуждения по ходу дела. Через некоторое время модель суммирует то, что она считает наиболее точным ответом. Те же принципы рассуждений использовала o1, но теперь пользователи могут «регулировать» время рассуждений: чем больше время, тем точнее ответ.

В ARC-AGI — тесте, разработанном для оценки того, может ли система ИИ эффективно получать новые навыки вне данных, на которых она была обучена — o3 достигла 87,5% баллов при высоких настройках вычислений. В худшем случае (при низких настройках вычислений) модель утроила производительность o1.

Разработчики также сообщают, что модель превосходит o1 на 22,8 п.п. в SWE-Bench Verified — бенчмарке, ориентированном на задачи программирования. Кроме того, при решении задач на программирование рейтинга Codeforces она набрала 2727 баллов. Разработчики, которые получают свыше 2600 баллов, получают на платформе звание международного гроссмейстера программирования — таких людей на Земле чуть больше 300.

Все сообщения о громких достижениях новой модели пока приводит только OpenAI. Модель пока не будет опубликована в общем доступе или по подписке. Компания до 10 января принимает заявки для регистрации групп тестировщиков безопасности и исследователей, которые первыми оценят возможности и риски новой модели.

ЧИТАЙТЕ ТАКЖЕ:





ПОМЕЧЕНО:ModelOpenAIбольшинствоНоваяобошлапланетыпрограммистовтестах
Комментариев нет Комментариев нет

Добавить комментарий Отменить ответ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

ЛУЧШИЕ НОВОСТИ


СВЕЖИЕ НОВОСТИ

Найден скрытый раздел Библии Нового Завета 1750-летней давности
Технологии
Чем важно присоединение Кыргызстана к совместной с Россией системе ПВО
Политика
Алексей Чумаков прокомментировал слухи о второй беременности жены
Шоу-бизнес
Путин допустил, что переговоры начнутся после провала ВСУ под Курском
Политика
Телескопы «Уэбб» и ALMA изучили ударную волну размером с Млечный Путь
Технологии
Сенатор Карасин: атаки БПЛА ВСУ на Татарстан вызывают гнев россиян
Политика
«Лавров явил чудо»: в Польше удивились ответу главы МИД на попытки Франции угрожать РФ
Общество
Самую старую мумию нашли в Египте: ей более 4 000 лет
Технологии
Актер Назаров может лишиться имущества за дискредитацию ВС РФ
Политика

Читайте также:

Технологии

Найдены останки ископаемого сумчатого животного с необычной «походкой»

31.05.2023
Технологии

США и Европа сняли с России обвинения в саботаже подводных кабелей в Балтике: что стало известно

21.01.2025
Технологии

Исследование показало, как россияне относятся к VR и AR на самом деле

24.04.2023
Технологии

Посмотрите на шаттл Дарт Вейдера в реальности: он летает 22 часа без перерыва

06.12.2022
Подписывайтесь на нас
Welcome Back!

Sign in to your account

Username or Email Address
Password

Забыли пароль?