• Спорт
  • Политика
  • Общество
  • Технологии
  • Шоу-бизнес
  • Авто
Чтение: OpenAI расшифровала более миллиона часов видео на YouTube для обучения ChatGPT
Поделиться
Уведомление Показать больше
Font ResizerAa
Font ResizerAa
  • Спорт
  • Политика
  • Общество
  • Технологии
  • Шоу-бизнес
  • Авто
Search
  • Спорт
  • Политика
  • Общество
  • Технологии
  • Шоу-бизнес
  • Авто
У вас есть существующая учетная запись? Войти
Подписывайтесь на нас
> Технологии > OpenAI расшифровала более миллиона часов видео на YouTube для обучения ChatGPT
Технологии

OpenAI расшифровала более миллиона часов видео на YouTube для обучения ChatGPT

08.04.2024
2 мин. чтение

Отчет New York Times подробно рассказывает, как крупные компании в области искусственного интеллекта решали проблему недостатка качественных данных для обучения ИИ. По данным журналистов лидеры рынка активно использовали «серые схемы», обсуждали возможность нарушения авторских прав и меняли пользовательские соглашения.

Компания OpenAI, как сообщается, разработала собственную модель для расшифровки аудио Whisper и использовала более миллиона часов видео с YouTube для обучения наиболее известной большой языковой модели GPT — 4. При этом журналисты пишут, что компания знала, что пользовательское соглашение YouTube запрещает автоматизированное распознавание видео.

Представители Google, которой принадлежит YouTube, сообщили The Verge, что компания «видела неподтвержденные сообщения» о деятельности OpenAI. Они также подтвердили, что Условия обслуживания запрещают несанкционированное сканирование или загрузку контента YouTube. При этом журналисты пишут, что Google не препятствовала сбору данных с видеохостинга, потому что также использовала расшифровку данных для обучения собственного ИИ.

С проблемой недостатка качественных данных также столкнулась Meta*, которой принадлежат социальные сети Instagram и Facebook. По данным американских журналистов, на внутренних совещаниях в компании обсуждали возможность использовать защищенный авторским правом контент несмотря на возможные иски или покупку издательства, чтобы получить доступ к книгам.

Модели ИИ становятся лучше, чем больше данных они поглощают. Разработчики таких систем находятся в постоянном поиске новых источников за пределами общедоступной информации в сети, которая уже полностью использована.

Возможное решение этой проблемы использовать синтетические данные. В этом случае модели ИИ сами генерируют искусственный контент и используют его для обучения. Но судя по многочисленным сообщениям и искам — компании также активно используют пользовательскую информацию несмотря на возможные риски.

* Компания Meta Platforms Inc. признана в России экстремистской. Деятельность компании и принадлежащих ей социальных сетей Facebook и Instagram на территории РФ запрещена

ПОМЕЧЕНО: ChatGPT, OpenAI, YouTube, более, видео, миллиона, обучения, расшифровала, часов
Maxim 08.04.2024
Оставить комментарий Оставить комментарий

Добавить комментарий Отменить ответ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

ЛУЧШИЕ НОВОСТИ

СВЕЖИЕ НОВОСТИ

Горячая линия по долгосрочным сбережениям заработает в России
«Юнона» максимально близко подлетела к ледяной луне Юпитера. На ней может быть жизнь
В Вашингтоне владельцы ресторанов перед выборами установили щиты на витринах
Responsible Statecraft: Глобальный Юг отвернулся от Запада, сохранив отношения с Москвой
Онколог Романов предупредил о повышенном слюноотделении при раке пищевода
В Зимбабве введено чрезвычайное положение из-за катастрофической засухи
Офицер ВС США Макгрегор назвал судьбу Зеленского после завершения конфликта
Психолог Вэй раскрыла сложные проблемы в браке сына Наташи Королевой
Украина входит в демографическую «спираль смерти»

Читайте также:

В Москве дожди, а в пустыне — выпал снег: посмотрите на редкое явление из космоса

27.06.2025

Обнаружено самое далекое мини-гало: радиосигнал прошел 10 млрд световых лет

27.06.2025

Товары для взрослых начнут продавать онлайн по биометрии

27.06.2025

Две трети абитуриентов выбирают ИИ как приоритетное ИТ-направление

27.06.2025
Подписывайтесь на нас
Welcome Back!

Sign in to your account

Забыли пароль?