• Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
Чтение: OpenAI расшифровала более миллиона часов видео на YouTube для обучения ChatGPT
Поделиться
Уведомление Показать больше
Font ResizerAa
Font ResizerAa
  • Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
Search
  • Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
У вас есть существующая учетная запись? Войти
Подписывайтесь на нас
Технологии

OpenAI расшифровала более миллиона часов видео на YouTube для обучения ChatGPT

08.04.2024
2 мин. чтение

Отчет New York Times подробно рассказывает, как крупные компании в области искусственного интеллекта решали проблему недостатка качественных данных для обучения ИИ. По данным журналистов лидеры рынка активно использовали «серые схемы», обсуждали возможность нарушения авторских прав и меняли пользовательские соглашения.

Компания OpenAI, как сообщается, разработала собственную модель для расшифровки аудио Whisper и использовала более миллиона часов видео с YouTube для обучения наиболее известной большой языковой модели GPT — 4. При этом журналисты пишут, что компания знала, что пользовательское соглашение YouTube запрещает автоматизированное распознавание видео.

Представители Google, которой принадлежит YouTube, сообщили The Verge, что компания «видела неподтвержденные сообщения» о деятельности OpenAI. Они также подтвердили, что Условия обслуживания запрещают несанкционированное сканирование или загрузку контента YouTube. При этом журналисты пишут, что Google не препятствовала сбору данных с видеохостинга, потому что также использовала расшифровку данных для обучения собственного ИИ.

С проблемой недостатка качественных данных также столкнулась Meta*, которой принадлежат социальные сети Instagram и Facebook. По данным американских журналистов, на внутренних совещаниях в компании обсуждали возможность использовать защищенный авторским правом контент несмотря на возможные иски или покупку издательства, чтобы получить доступ к книгам.

Модели ИИ становятся лучше, чем больше данных они поглощают. Разработчики таких систем находятся в постоянном поиске новых источников за пределами общедоступной информации в сети, которая уже полностью использована.

Возможное решение этой проблемы использовать синтетические данные. В этом случае модели ИИ сами генерируют искусственный контент и используют его для обучения. Но судя по многочисленным сообщениям и искам — компании также активно используют пользовательскую информацию несмотря на возможные риски.

* Компания Meta Platforms Inc. признана в России экстремистской. Деятельность компании и принадлежащих ей социальных сетей Facebook и Instagram на территории РФ запрещена

ЧИТАЙТЕ ТАКЖЕ:





ПОМЕЧЕНО:ChatGPTOpenAIYouTubeболеевидеомиллионаобучениярасшифровалачасов
Комментариев нет Комментариев нет

Добавить комментарий Отменить ответ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

ЛУЧШИЕ НОВОСТИ


СВЕЖИЕ НОВОСТИ

В Мексике хозяева крематория не успели сжечь 383 тела и спрятали их
Общество
В Германии нашли ужасным заявление главы МИД Германии Бербок о Путине
Политика
Деньги не вернут: россиян предостерегли от опасных банковских вкладов
Общество
«Мы готовы выслушать»: Офис Зеленского сделал неожиданное заявление о России
Политика
Омбудсмен Москалькова сообщила, что госпитализирована в больницу
Общество
Бактерии из мяса могут вызывать больше полмиллиона случаев ИМП в год
Технологии
Западный мир сжимает «Петлю Анаконды» вокруг России
Политика
«Остановился и прикусил»: Малаховой пришлось пройти курс лечения от бешенства
Шоу-бизнес
России некуда деваться, считает Медведев
Политика

Читайте также:

Политика

Появилось видео последствий ракетного удара по Клинцам в Брянской области

13.12.2022
Общество

Инфекционист Поздняков рассказал, кто более подвержен заражению туберкулезом

28.03.2025
Технологии

MIT: врачи при помощи ИИ диагностируют рак быстрее и чаще

11.07.2022
Технологии

Посмотрите на встречу Марса и Луны: Красная планета «выглядывает» из-за нее

31.01.2023
Подписывайтесь на нас
Welcome Back!

Sign in to your account

Username or Email Address
Password

Забыли пароль?