• Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
Чтение: ИИ Alibaba создает реалистичные видео по одной фотографии
Поделиться
Уведомление Показать больше
Font ResizerAa
Font ResizerAa
  • Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
Search
  • Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
У вас есть существующая учетная запись? Войти
Подписывайтесь на нас
Технологии

ИИ Alibaba создает реалистичные видео по одной фотографии

01.03.2024
2 мин. чтение

Программисты Alibaba разработали систему, способную анимировать одну портретную фотографию и создавать реалистичные видеоролики говорящего или поющего человека. В демонстрационных роликах инженеры «заставляют» реальные фотографии или даже картины читать рэп, петь песни или произносить монолог из театральных пьес.


Демонстрация возможностей EMO
Для разработки EMO исследователи из Института интеллектуальных вычислений Alibaba обучили систему, используя набор данных, состоящий из более чем 250 часов видео «говорящих голов», взятых из различных источников, таких как речи, фильмы, телешоу и вокальные выступления. В системе используется диффузионная модель — технология ИИ, которая уже показала эффективность при создании реалистичных синтетических изображений.

В то время как существующие методы создания анимации музыки или аудио в значительной степени полагались на 3D-моделирование или смешивание форм для имитации движения лица, EMO использует более прямой подход. Он преобразует звуковые волны непосредственно в видеокадры, в результате чего получается удивительно естественная анимация, отражающая тонкие манеры и индивидуальные особенности человека.

В экспериментах, описанных в исследовательской статье, опубликованной на arXiv, EMO превзошла существующие современные методы с точки зрения качества видео, сохранения идентичности и выразительности. Исследование пользователей, проведенное исследователями, также показало, что видеоролики, созданные EMO, воспринимаются как более естественные и эмоциональные, чем видеоролики, созданные другими системами.

EMO может не только создавать реалистичные диалоговые видеоролики, но также анимировать поющие портреты с соответствующими формами рта и выражениями лица, синхронизированными с вокалом. Система поддерживает создание видео произвольной продолжительности в зависимости от длины входного аудио.

ЧИТАЙТЕ ТАКЖЕ:





ПОМЕЧЕНО:Alibabaвидеооднойреалистичныесоздаетфотографии
Комментариев нет Комментариев нет

Добавить комментарий Отменить ответ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

ЛУЧШИЕ НОВОСТИ


СВЕЖИЕ НОВОСТИ

Посмотрите на робота-змею, созданного для поиска жизни на спутнике Сатурна
Технологии
Российские туристы опасаются ехать в Дагестан и Крым из-за терактов
Общество
ВВС Дании ускорят передачу Украине F-16, списав их раньше срока
Политика
Ученые выяснили, что сознание человека живет еще три минуты после смерти
Общество
Первая за 100 лет вакцина от туберкулеза вошла в финальную фазу испытаний
Технологии
Мошенники придумали новую схему оформления кредита на чужое имя
Общество
Блогер Клубника публично обратился к Кадырову из-за притеснения чеченцами
Общество
Контратака ВСУ была сорвана из-за обмана украинских мобилизованных
Политика
МК: Американский аналитик поделился пугающим прогнозом на 2023 год
Политика

Читайте также:

Оказалось, что жизнь в космосе может начинаться еще до рождения планет

02.08.2025
Технологии

Названы самые уязвимые приложения в России: данные пользователей под угрозой

23.04.2025
Технологии

Физики открыли способ перемещения предметов с помощью ультразвука

06.12.2022
Технологии

У побережья Китая нашли огромное сверхмелководное месторождение газа

08.08.2024
Подписывайтесь на нас
Welcome Back!

Sign in to your account

Username or Email Address
Password

Забыли пароль?