• Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
Чтение: ИИ Alibaba создает реалистичные видео по одной фотографии
Поделиться
Уведомление Показать больше
Font ResizerAa
Font ResizerAa
  • Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
Search
  • Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
У вас есть существующая учетная запись? Войти
Подписывайтесь на нас
Технологии

ИИ Alibaba создает реалистичные видео по одной фотографии

01.03.2024
2 мин. чтение

Программисты Alibaba разработали систему, способную анимировать одну портретную фотографию и создавать реалистичные видеоролики говорящего или поющего человека. В демонстрационных роликах инженеры «заставляют» реальные фотографии или даже картины читать рэп, петь песни или произносить монолог из театральных пьес.


Демонстрация возможностей EMO
Для разработки EMO исследователи из Института интеллектуальных вычислений Alibaba обучили систему, используя набор данных, состоящий из более чем 250 часов видео «говорящих голов», взятых из различных источников, таких как речи, фильмы, телешоу и вокальные выступления. В системе используется диффузионная модель — технология ИИ, которая уже показала эффективность при создании реалистичных синтетических изображений.

В то время как существующие методы создания анимации музыки или аудио в значительной степени полагались на 3D-моделирование или смешивание форм для имитации движения лица, EMO использует более прямой подход. Он преобразует звуковые волны непосредственно в видеокадры, в результате чего получается удивительно естественная анимация, отражающая тонкие манеры и индивидуальные особенности человека.

В экспериментах, описанных в исследовательской статье, опубликованной на arXiv, EMO превзошла существующие современные методы с точки зрения качества видео, сохранения идентичности и выразительности. Исследование пользователей, проведенное исследователями, также показало, что видеоролики, созданные EMO, воспринимаются как более естественные и эмоциональные, чем видеоролики, созданные другими системами.

EMO может не только создавать реалистичные диалоговые видеоролики, но также анимировать поющие портреты с соответствующими формами рта и выражениями лица, синхронизированными с вокалом. Система поддерживает создание видео произвольной продолжительности в зависимости от длины входного аудио.

ЧИТАЙТЕ ТАКЖЕ:





ПОМЕЧЕНО:Alibabaвидеооднойреалистичныесоздаетфотографии
Комментариев нет Комментариев нет

Добавить комментарий Отменить ответ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

ЛУЧШИЕ НОВОСТИ


СВЕЖИЕ НОВОСТИ

На Павла Деревянко написали заявление в полицию
Шоу-бизнес
Т-14 «Армата» ВС России по многим параметрам превосходит лучшие западные танки НАТО
Политика
Цены на бананы из Эквадора растут не настолько, чтобы отпугнуть россиян
Политика
ЕС смягчил санкции для россиян
Политика
До 50 тысяч бойцов: Эксперт Матвийчук оценил вклад спецназа КНДР под Курском
Политика
Сенатор от Юты не исключает, что «Северные потоки» подорвали США
Политика
Express: Киев пал бы меньше чем за неделю, если бы Британия не вышла из ЕС
Политика
Какие страны могут скоро исчезнуть, предупредил эксперт
Общество
За «чайлдфри» буду штрафовать на миллион
Общество

Читайте также:

Технологии

Роскомнадзор готов принять меры против YouTube

19.12.2024
Технологии

Длительность земного дня увеличивается. Ученые не знают почему

07.08.2022
Технологии

Разработана технология для создания стираемых 3D-картинок

09.08.2024
Технологии

Физики впервые сфотографировали отдельные атомы, плавающие в жидкости

27.07.2022
Подписывайтесь на нас
Welcome Back!

Sign in to your account

Username or Email Address
Password

Забыли пароль?