• Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
Чтение: Очки с ИИ научили «читать по губам» без использования камеры
Поделиться
Уведомление Показать больше
Font ResizerAa
Font ResizerAa
  • Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
Search
  • Главная
  • Политика
  • Общество
  • Шоу-бизнес
  • Спорт
  • Авто
У вас есть существующая учетная запись? Войти
Подписывайтесь на нас
Технологии

Очки с ИИ научили «читать по губам» без использования камеры

06.04.2023
2 мин. чтение

Исследователи из Корнельского университета разработали интерфейс EchoSpeech для распознавания тихой речи, который использует акустическое восприятие и искусственный интеллект для непрерывного распознавания до 31 невокализованной команды на основе движений губ и рта. Обработка информации осуществляется локально на смартфоне, что обеспечивает конфиденциальность данных.

Очки EchoSpeech оснащены парой микрофонов и динамиков, размер которых меньше ластика на конце карандаша, и не используют камеру. Устройство отправляет и улавливает акустические волны, которые показывают изменения динамики лицевых мышц и рта. Алгоритм глубокого обучения анализирует эти эхо-профили в режиме реального времени с точностью около 95%.

Очки с ИИ научили «читать по губам» без использования камеры

Принцип работы EchoSpeech. Изображение: Ruidong Zhang et al.
Полученные данные передаются через Bluetooth в режиме реального времени на смартфон, обрабатываются и хранятся локально на устройстве. Разработчики сообщают, что EchoSpeech достаточно нескольких минут для обучения для конкретного пользователя.

Для людей, которые не могут говорить, эта технология безмолвной речи может стать отличным голосовым синтезатором. Она может вернуть пациентам их голос.
Жуйдун Чжан, соавтор разработки
Большинство технологий распознавания немой речи ограничены избранным набором предопределенных команд и требуют, чтобы пользователь и его собеседник смотрели в камеру или носили ее. Это существенно затрудняет возможности применения таких устройств. Кроме того, большой поток данных требует обработки в облаке, что нарушает конфиденциальность пользователей.

В своем нынешнем виде EchoSpeech можно использовать для общения с другими через смартфон в местах, где речь неудобна или неуместна, например, в шумном ресторане или тихой библиотеке. Бесшумный речевой интерфейс также можно использовать в паре со стилусом и программным обеспечением для проектирования, таким как САПР, практически исключая необходимость в клавиатуре и мыши, добавляют разработчики.

ЧИТАЙТЕ ТАКЖЕ:





ПОМЕЧЕНО:использованиякамерынаучиличитать по губам
Комментариев нет Комментариев нет

Добавить комментарий Отменить ответ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

ЛУЧШИЕ НОВОСТИ


СВЕЖИЕ НОВОСТИ

Украинский стендап-комик Щегель сбежал из страны после получения повесток
Политика
Подросток на питбайке насмерть сбил пенсионерку в Белореченске
Общество
Уиткофф и Кушнер собираются провести переговоры в Москве
Политика
Бородюк прокомментировал возможную отставку
Спорт
Эксперт из США: Россия имеет сбивать помогающие ВСУ спутники Starlink
Общество
Метания Цукерберга выдали диктат либералов в США – Пушков
Общество
«Ждем ваше чудо»: беременная Краймбрери принимает поздравления от фанатов и коллег
Шоу-бизнес
Ученые доказали, что планеты в системе TRAPPIST-1 могут быть обитаемы
Технологии
Тревел-блогер из РФ посетила Германию и восхитилась современностью немецких пенсионеров
Политика

Читайте также:

Технологии

Разработан генератор для ветряных электростанций без дорогих магнитов

13.09.2022
Технологии

«Джеймс Уэбб» не нашел предсказанной «нестабильности» ранней Вселенной

29.08.2023
Технологии

Скоро появится новый часовой пояс: зачем он нужен

05.04.2024
Технологии

Инженеры создали «квантовые композиты» для электрических и оптических инноваций

19.04.2023
Подписывайтесь на нас
Welcome Back!

Sign in to your account

Username or Email Address
Password

Забыли пароль?