• Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
Чтение: Очки с ИИ научили «читать по губам» без использования камеры
Поделиться
Уведомление Показать больше
Font ResizerAa
Font ResizerAa
  • Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
Search
  • Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
У вас есть существующая учетная запись? Войти
Подписывайтесь на нас
Технологии

Очки с ИИ научили «читать по губам» без использования камеры

06.04.2023
2 мин. чтение

Исследователи из Корнельского университета разработали интерфейс EchoSpeech для распознавания тихой речи, который использует акустическое восприятие и искусственный интеллект для непрерывного распознавания до 31 невокализованной команды на основе движений губ и рта. Обработка информации осуществляется локально на смартфоне, что обеспечивает конфиденциальность данных.

Очки EchoSpeech оснащены парой микрофонов и динамиков, размер которых меньше ластика на конце карандаша, и не используют камеру. Устройство отправляет и улавливает акустические волны, которые показывают изменения динамики лицевых мышц и рта. Алгоритм глубокого обучения анализирует эти эхо-профили в режиме реального времени с точностью около 95%.

Очки с ИИ научили «читать по губам» без использования камеры

Принцип работы EchoSpeech. Изображение: Ruidong Zhang et al.
Полученные данные передаются через Bluetooth в режиме реального времени на смартфон, обрабатываются и хранятся локально на устройстве. Разработчики сообщают, что EchoSpeech достаточно нескольких минут для обучения для конкретного пользователя.

Для людей, которые не могут говорить, эта технология безмолвной речи может стать отличным голосовым синтезатором. Она может вернуть пациентам их голос.
Жуйдун Чжан, соавтор разработки
Большинство технологий распознавания немой речи ограничены избранным набором предопределенных команд и требуют, чтобы пользователь и его собеседник смотрели в камеру или носили ее. Это существенно затрудняет возможности применения таких устройств. Кроме того, большой поток данных требует обработки в облаке, что нарушает конфиденциальность пользователей.

В своем нынешнем виде EchoSpeech можно использовать для общения с другими через смартфон в местах, где речь неудобна или неуместна, например, в шумном ресторане или тихой библиотеке. Бесшумный речевой интерфейс также можно использовать в паре со стилусом и программным обеспечением для проектирования, таким как САПР, практически исключая необходимость в клавиатуре и мыши, добавляют разработчики.

ЧИТАЙТЕ ТАКЖЕ:





ПОМЕЧЕНО:использованиякамерынаучиличитать по губам
Комментариев нет Комментариев нет

Добавить комментарий Отменить ответ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

ЛУЧШИЕ НОВОСТИ


СВЕЖИЕ НОВОСТИ

Физик Саврин рассказал, как из Европы изгоняют российских учёных
Политика
Скончался директор Филиппа Киркорова
Шоу-бизнес
Путину придётся выбирать одну из двух катастроф — эксперт
Политика
Лосенок с переломанными ногами умирает на обочине трассы в Подмосковье
Общество
В Нидерландах арестовали фальшивого Бориса Джонсона с украинскими правами
Политика
Панин — о жизни в Испании: «Живу на те деньги, которые остались»
Шоу-бизнес
США будут добиваться проведения выборов на Украине — Кедми
Политика
Автор «Игры престолов» и другие писатели подали в суд на создателя ChatGPT
Технологии
Ольга Бузова подогрела слухи о своей скорой свадьбе
Шоу-бизнес

Читайте также:

Технологии

Физики придумали принципиально новый метод поиска темной материи

25.03.2023
Технологии

Посмотрите на новый снимок сверхновой Тихо Браге, взорвавшейся 450 лет назад

01.03.2023
Технологии

Наночастицы серебра повысили эффективность нейтронов в борьбе с раком

21.03.2025
Технологии

Робот — морской краб вертикально закапывается, чтобы исследовать подземелья

12.10.2022
Подписывайтесь на нас
Welcome Back!

Sign in to your account

Username or Email Address
Password

Забыли пароль?