• Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
Чтение: OpenAI расшифровала более миллиона часов видео на YouTube для обучения ChatGPT
Поделиться
Уведомление Показать больше
Font ResizerAa
Font ResizerAa
  • Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
Search
  • Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
У вас есть существующая учетная запись? Войти
Подписывайтесь на нас
Технологии

OpenAI расшифровала более миллиона часов видео на YouTube для обучения ChatGPT

08.04.2024
2 мин. чтение

Отчет New York Times подробно рассказывает, как крупные компании в области искусственного интеллекта решали проблему недостатка качественных данных для обучения ИИ. По данным журналистов лидеры рынка активно использовали «серые схемы», обсуждали возможность нарушения авторских прав и меняли пользовательские соглашения.

Компания OpenAI, как сообщается, разработала собственную модель для расшифровки аудио Whisper и использовала более миллиона часов видео с YouTube для обучения наиболее известной большой языковой модели GPT — 4. При этом журналисты пишут, что компания знала, что пользовательское соглашение YouTube запрещает автоматизированное распознавание видео.

Представители Google, которой принадлежит YouTube, сообщили The Verge, что компания «видела неподтвержденные сообщения» о деятельности OpenAI. Они также подтвердили, что Условия обслуживания запрещают несанкционированное сканирование или загрузку контента YouTube. При этом журналисты пишут, что Google не препятствовала сбору данных с видеохостинга, потому что также использовала расшифровку данных для обучения собственного ИИ.

С проблемой недостатка качественных данных также столкнулась Meta*, которой принадлежат социальные сети Instagram и Facebook. По данным американских журналистов, на внутренних совещаниях в компании обсуждали возможность использовать защищенный авторским правом контент несмотря на возможные иски или покупку издательства, чтобы получить доступ к книгам.

Модели ИИ становятся лучше, чем больше данных они поглощают. Разработчики таких систем находятся в постоянном поиске новых источников за пределами общедоступной информации в сети, которая уже полностью использована.

Возможное решение этой проблемы использовать синтетические данные. В этом случае модели ИИ сами генерируют искусственный контент и используют его для обучения. Но судя по многочисленным сообщениям и искам — компании также активно используют пользовательскую информацию несмотря на возможные риски.

* Компания Meta Platforms Inc. признана в России экстремистской. Деятельность компании и принадлежащих ей социальных сетей Facebook и Instagram на территории РФ запрещена

ЧИТАЙТЕ ТАКЖЕ:





ПОМЕЧЕНО:ChatGPTOpenAIYouTubeболеевидеомиллионаобучениярасшифровалачасов
Комментариев нет Комментариев нет

Добавить комментарий Отменить ответ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

ЛУЧШИЕ НОВОСТИ


СВЕЖИЕ НОВОСТИ

Экономист объяснил, что стоит покупать россиянам с каждой зарплаты
Общество
Бен Аффлек не выдержал брака с Дженнифер Лопес из-за характера певицы
Политика
Тайная свадьба? Молодая возлюбленная Курбана Омарова назвала его мужем
Шоу-бизнес
Military Watch: 1500 танков Т-90М «Прорыв» и Т-14 «Армата» построят в России
Политика
Названы 9 продуктов для снижения уровня сахара в крови
Политика
Полковник Киселев: Теракт в Брянской области был санкционирован Зеленским
Политика
В США директор зоопарка выжил после 16 укусов ядовитой змеи и рассказал об этом
Общество
Мэрия Владивостока обратилась к работодателям в связи с грядущей непогодой
Общество
Неожиданная отставка в украинском генералитете: зачем убрали Виктора Хоренко
Политика

Читайте также:

Технологии

Найден первый пример «живого оригами»: микроб складывается, как бумажные фигурки

08.06.2024
Технологии

РКН пообещал обезличить данные россиян, но эксперты сомневаются эффективности метода

29.03.2025
Технологии

В России создали ИИ-платформу для ускоренной разработки лекарств

21.02.2025
Технологии

Созданы высокопроизводительные волноводы для «фотонных чипов нового поколения»

30.07.2022
Подписывайтесь на нас
Welcome Back!

Sign in to your account

Username or Email Address
Password

Забыли пароль?