MForum.ru
07.11.2021,
Задачу автоматического распознавания речи стараются решить с помощью ИИ. Достигнуты хорошие результаты, если сравнивать с тем, что получалось делать ранее. Вместе с тем, по состоянию на 2021 года мне не доводилось видеть систем, которые безошибочно распознавали бы диктовку хотя бы на одном языке, не говоря уже о ситуациях со сленгом, активным использовании иностранных слов и технических терминов. Как правило, речь всегда идет о проценте верно расознанных слов и этот процент редко когда доходит до 90%.
Распознавание речи зависит от качества звукового сигнала.
Различают распознавание в реальном времени и распознавание предварительно записанного звукового файла.
ПО для распознавания может иметь нулевой физический интерфейс, оно может располагаться на вычислительных ресурсах пользователя или в облаке, на платформе соответствующего сервиса. Иногда для устройств распознавания предусматривают физический интерфейс, как, например, в случае с "умными колонками". Впрочем, в ситуациях, когда есть физический интерфейс, как правило, речь идет об устройстве с более развитым функционалом, чем только распознавание, например, также о синтезе речи, анализе распознанной речи и каких-то действиях, которое устройство способно выполнять, ориентируясь на распознанные запросы пользователя. Эти возможности легли в основу голосовых чат-ботов и "умных колонок".
Есть устройства, адресованные инвалидам, например, устройства, которые преобразуют слышимую речь в текст на экране смартфона или компьютера. Впрочем, от возможности "протоколировать" разговоры вряд ли откажутся и многие люди с обычными возможностями. Такие устройства упростили бы жизнь и для тех, кто не слишком хорошо воспринимает на слух речь на иностранном языке, хотя способен понимать написанный на этом языке текст и произносить простые фразы.
Новости
2021.12.07 Устройство распознавания речи «Чарли» компании "Сенсор-Тех" тестируют в новой лаборатории клиентского опыта Почты России в Технопарке «Сколково». «Чарли» позволяет разговаривать с глухими и слепоглухими без помощи сурдопереводчиков.
--
Публикации по теме:
17.04. Билайн нарастил долю в Voca-Tech, укрепив позиции на рынке голосовой аналитики
07.03. Билайн Big Data & AI повысил точность распознавания речи в аудиозаписях до 85%
28.01. MCN Telecom в 2019 году нарастила выручку на 20%
21.03. Day-by-Day, 2016.03.19-20, выходные. Дайджест Телеком и Роботы
19.07. Семейство роботов-собеседников пополнит Buddy
23.04.
Персональный робот
23.04.
Каталог роботов по-названиям
26.09. социальный робот
26.08. робот-собеседник
24.06. персональный помощник
23.05. Домашний робот
15.07.
Итоги недели: Все самое интересное с 8 по 14 июля 2013 года
12.01.
Итоги 2011: события и тренды
05.09.
Итоги недели: Все самое интересное с 22 по 28 августа 2011 года
30.08.
Samsung представляет новую мобильную платформу bada 2.0 и SDK под нее
30.08. Кратко о новинках, слухах, анонсах
07.01.
Словарные статьи, начинающиеся на букву Р (кир.)
05.01.
Google Nexus One объявлен официально
14.02. "Мир Call-центров" откроется 20 марта
27.01.
Имиджевый и умный
[Распознавание речи. Устройства для людей с ограниченными возможностями]
В «Сколково» появятся «умные» гаджеты для общения с глухими и слепоглухими людьми
Пресс-релиз, 07.12.2021, через MForum.ru. Устройство распознавания речи «Чарли» тестируют в новой лаборатории клиентского опыта Почты России в Технопарке «Сколково». «Чарли» позволяет разговаривать с глухими и слепоглухими без помощи сурдопереводчиков.
С помощью алгоритмов искусственного интеллекта «Чарли» распознает речь и моментально выводит ее в виде текста на экран любого подключенного устройства (планшета, компьютера или смартфона). Таким образом, неслышащий может легко прочитать то, что ему говорят. Для общения со слепоглухими к гаджету подключается дисплей Брайля, и у человека с нарушениями слуха и зрения появляется возможность прочитать информацию пальцами и ввести ответ. Устройство распознавания речи «Чарли» разработали в московской Лаборатории «Сенсор-Тех», которая специализируется на создании «умных» технологий для людей с инвалидностью (резидент Фонда «Сколково»).
«Чарли» уже используют в МФЦ, университетах, поликлиниках, аптеках, центрах занятости и в других общественных местах. Теперь устройство тестируют в лаборатории клиентского опыта Почты России в «Сколково». Это новая зона пилотирования инновационных услуг для клиентов компании. Формат классического отделения, в котором действует лаборатория, позволит протестировать инновационные решения сразу в реальных условиях бизнес-процессов Почты.
«Пойти куда-то по делам без сопровождения – настоящая проблема, с которой ежедневно сталкиваются глухие и, тем более, слепоглухие. Им сложно общаться с людьми, многие просто не знают, как это сделать, как понять их ответ на обращение. Зачастую дискомфорт испытывают и слышащие люди, которым нужно что-то объяснить глухому. «Чарли» решает эти проблемы для обеих сторон. Гаджет помогает выстраивать диалог, дает возможность общаться с помощью "субтитров", в которые он мгновенно переводит речь», - сказал Денис Кулешов, директор Лаборатории «Сенсор-Тех».
Большинство устройств и приложений, которые распознают речь, созданы для «общения» человека с компьютером, а не для прямого диалога между людьми. «Чарли» - единственный в России гаджет с использованием традиционного рельефного шрифта Брайля, с помощью которого можно коммуницировать со слепоглухими.
«В нашей новой лаборатории мы планируем тестировать не только решения, которые расширяют список наших услуг или трансформируют их, но и такие устройства как «Чарли». В будущем такие проекты помогут повысить доступность сервисов компании для клиентов с особыми возможностями здоровья», – отметил Никита Жучков, руководитель офиса открытых инноваций Почты России.
В 2020 году, когда многие стали учиться и работать в удаленном режиме, «Чарли» получил специальную функцию дистанционного общения. Например, преподаватель в институте может положить гаджет рядом с собой во время лекции, а студенты с нарушением слуха, подключившись к программе по специальной ссылке, будут читать расшифрованную речь лектора дома, на экране смартфона или компьютера, в режиме онлайн.
Таким же образом можно проводить рабочие встречи, совещания, любые образовательные мероприятия или выступления. Для этого необходим лишь доступ к Интернету.
Справочная информация
АНО «Лаборатория «Сенсор-Тех» была основана в 2016 году при поддержке «Фонда поддержки слепоглухих «Со-единение». Цель проекта – разработка технологических решений для социализации людей с нарушениями слуха и зрения, в том числе слепоглухих, в России. Тематика исследований и разработок Лаборатории охватывает широкий спектр направлений науки и техники, в том числе биоинженерию, биотехнические системы, наноэлектронику и электротехнику, информационно-коммуникационные системы, неврологию и нейрофизиологию, генетику. Среди проектов Лаборатории «Сенсор-Тех»: офтальмологический VR-симулятор See My World, имитирующий различные нарушения зрения; приложение «Определитель купюр» для незрячих; умный помощник «Робин» и устройство для распознавания речи «Чарли». В 2017 году Лаборатория «Сенсор-Тех» участвовала в проведении первых в России операций по установке бионического импланта людям с нарушенным зрением. В 2019 году «Сенсор-Тех» стала резидентом Фонда «Сколково». В 2021 году компания представила первый в России нейроимплант, который вернет зрение тотально слепым людям. Сайт компании:
15.05. Специалисты по ИБ без опыта работы не нужны почти никому
15.05. Ericsson предупреждает операторов - они упускают возможности, связанные с 5G и ИИ
15.05. Рынок SiC и GaN в Китае демонстрирует интересные тренды
15.05. Прогноз развития телекоммуникационной отрасли России дадут на ЦИПР-2026
15.05. В NASA тестируют процессор нового поколения для использования в условиях космоса
15.05. МТС обеспечила покрытием LTE станцию «Спортивная» в метро Новосибирска
15.05. Билайн в Пермском крае - 4G улучшен в 13 населенных пунктах к дачному сезону
14.05. Монокристалл - в шаге от банкротства?
14.05. Услуги D2D - консолидация вместо конкуренции? В США
14.05. Мировой рынок RAN в 1q2026 остался стабильным пятый квартал подряд
14.05. Ускорители ИИ Nvidia в рамках конфликта США и Китая
14.05. В России работают над проектом рентгеновского фотолитографа
14.05. Виктория Морозова назначена директором по маркетингу МТС Web Services
15.05. Представлен Moto Tag 2 с 600 днями работы, UWB и Google Find Hub
15.05. Xiaomi тизерит Band 10 Pro и наушники-клипсы
14.05. Oppo может получить улучшенную квадратную фронталку разрешением 100 МП
14.05. Vivo Y60 – бюджетник с экраном 120 Гц и АКБ 6500 мАч
13.05. Nubia GT Buds – прозрачный дизайн, RGB-подсветка и ANC за $39
13.05. Samsung запускает One UI 9 Beta на базе Android 17, ещё до анонса ОС от Google
13.05. Honor Pad 20 с дисплеем 12.1" 3K, Snapdragon 7 Gen 3 и АКБ 10 100 мАч показали на тизерах
11.05. Huawei Watch Fit 5 и Watch Fit 5 Pro выходят на глобальный рынок
11.05. Acer Iconia iM11 5G – Dimensity 7050, 5G и 7400 мАч за $249
08.05. OnePlus Nord CE6 Lite с 7000 мАч, 144 Гц LCD и Dimensity 7400 Apex представлен официально
08.05. OnePlus Nord CE6 с АКБ 8000 мАч, AMOLED-экраном 144 Гц и Snapdragon 7s Gen 4 представлен официально
07.05. Honor Play 11 Plus – 7000 мАч, 120 Гц AMOLED и Dimensity 6500 Elite за $320
07.05. Honor Play 70C – Helio G81 Ultra, 5300 мАч и Android 15 за $90
06.05. Honor Play 80 Plus – 7500 мАч, Snapdragon 4 Gen 4 и AI-кнопка за $249
06.05. Samsung Galaxy S27 Ultra получит переменную диафрагму в основной камере?
06.05. Samsung Galaxy A27 – круглый вырез камеры, Snapdragon 6 Gen 3 и 12 МП фронталка
05.05. Xiaomi Smart Band 10 Pro – 1.74" AMOLED, алюминиевый корпус и 21 день работы
05.05. iQOO 15T – 200 МП камера, 8000 мАч, 100 Вт и Dimensity 9500
05.05. Lenovo Legion Y70 (2026) – 2K-экран, 8000 мАч и SD 8 Gen 5
04.05. 7 мая представят Huawei Nova 15 Max – 8500 мАч, 50 МП RYYB и AMOLED