• Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
Чтение: ИИ Alibaba создает реалистичные видео по одной фотографии
Поделиться
Уведомление Показать больше
Font ResizerAa
Font ResizerAa
  • Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
Search
  • Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
У вас есть существующая учетная запись? Войти
Подписывайтесь на нас
Технологии

ИИ Alibaba создает реалистичные видео по одной фотографии

01.03.2024
2 мин. чтение

Программисты Alibaba разработали систему, способную анимировать одну портретную фотографию и создавать реалистичные видеоролики говорящего или поющего человека. В демонстрационных роликах инженеры «заставляют» реальные фотографии или даже картины читать рэп, петь песни или произносить монолог из театральных пьес.


Демонстрация возможностей EMO
Для разработки EMO исследователи из Института интеллектуальных вычислений Alibaba обучили систему, используя набор данных, состоящий из более чем 250 часов видео «говорящих голов», взятых из различных источников, таких как речи, фильмы, телешоу и вокальные выступления. В системе используется диффузионная модель — технология ИИ, которая уже показала эффективность при создании реалистичных синтетических изображений.

В то время как существующие методы создания анимации музыки или аудио в значительной степени полагались на 3D-моделирование или смешивание форм для имитации движения лица, EMO использует более прямой подход. Он преобразует звуковые волны непосредственно в видеокадры, в результате чего получается удивительно естественная анимация, отражающая тонкие манеры и индивидуальные особенности человека.

В экспериментах, описанных в исследовательской статье, опубликованной на arXiv, EMO превзошла существующие современные методы с точки зрения качества видео, сохранения идентичности и выразительности. Исследование пользователей, проведенное исследователями, также показало, что видеоролики, созданные EMO, воспринимаются как более естественные и эмоциональные, чем видеоролики, созданные другими системами.

EMO может не только создавать реалистичные диалоговые видеоролики, но также анимировать поющие портреты с соответствующими формами рта и выражениями лица, синхронизированными с вокалом. Система поддерживает создание видео произвольной продолжительности в зависимости от длины входного аудио.

ЧИТАЙТЕ ТАКЖЕ:





ПОМЕЧЕНО:Alibabaвидеооднойреалистичныесоздаетфотографии
Комментариев нет Комментариев нет

Добавить комментарий Отменить ответ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

ЛУЧШИЕ НОВОСТИ


СВЕЖИЕ НОВОСТИ

По миллиону получат приморские многодетные семьи
Общество
В подмосковном Дмитровском отключили отопление из-за утечки
Общество
Финляндия намерена остановить экспорт гражданских боеприпасов в Россию
Политика
В какие банки не стоит нести свои деньги, предупредил экономист
Общество
Солнечное пятно размером с Землю выросло в 10 раз за 2 дня: оно направлено на нас
Технологии
«Сам ничего не умеет»: Юрий Лоза обругал раскритиковавшего его Сергея Соседова
Шоу-бизнес
Скандал со школой при посольстве РФ в Варшаве усилит напряженность в отношениях с Польшей
Политика
В живых останутся единицы: Фурсов предупредил о смертельной «перезагрузке» элиты
Общество
Поведение принца Гарри привело в ярость королеву Камиллу
Шоу-бизнес

Читайте также:

Технологии

Откуда на Земле появилась вода: ученые опровергает старые теории

05.12.2024
Общество

Артист Джигурда не стал скрывать, почему целовал Волочкову на видео

23.01.2024
Технологии

Якутские инженеры создали боевого «Скорпиона» для битвы роботов

25.04.2025
Технологии

Трамп лидирует на выборах США: на фоне событий биткоин побил историческую отметку

06.11.2024
Подписывайтесь на нас
Welcome Back!

Sign in to your account

Username or Email Address
Password

Забыли пароль?