MForum.ru
07.11.2021,
Задачу автоматического распознавания речи стараются решить с помощью ИИ. Достигнуты хорошие результаты, если сравнивать с тем, что получалось делать ранее. Вместе с тем, по состоянию на 2021 года мне не доводилось видеть систем, которые безошибочно распознавали бы диктовку хотя бы на одном языке, не говоря уже о ситуациях со сленгом, активным использовании иностранных слов и технических терминов. Как правило, речь всегда идет о проценте верно расознанных слов и этот процент редко когда доходит до 90%.
Распознавание речи зависит от качества звукового сигнала.
Различают распознавание в реальном времени и распознавание предварительно записанного звукового файла.
ПО для распознавания может иметь нулевой физический интерфейс, оно может располагаться на вычислительных ресурсах пользователя или в облаке, на платформе соответствующего сервиса. Иногда для устройств распознавания предусматривают физический интерфейс, как, например, в случае с "умными колонками". Впрочем, в ситуациях, когда есть физический интерфейс, как правило, речь идет об устройстве с более развитым функционалом, чем только распознавание, например, также о синтезе речи, анализе распознанной речи и каких-то действиях, которое устройство способно выполнять, ориентируясь на распознанные запросы пользователя. Эти возможности легли в основу голосовых чат-ботов и "умных колонок".
Есть устройства, адресованные инвалидам, например, устройства, которые преобразуют слышимую речь в текст на экране смартфона или компьютера. Впрочем, от возможности "протоколировать" разговоры вряд ли откажутся и многие люди с обычными возможностями. Такие устройства упростили бы жизнь и для тех, кто не слишком хорошо воспринимает на слух речь на иностранном языке, хотя способен понимать написанный на этом языке текст и произносить простые фразы.
Новости
2021.12.07 Устройство распознавания речи «Чарли» компании "Сенсор-Тех" тестируют в новой лаборатории клиентского опыта Почты России в Технопарке «Сколково». «Чарли» позволяет разговаривать с глухими и слепоглухими без помощи сурдопереводчиков.
--
Публикации по теме:
17.04. Билайн нарастил долю в Voca-Tech, укрепив позиции на рынке голосовой аналитики
07.03. Билайн Big Data & AI повысил точность распознавания речи в аудиозаписях до 85%
28.01. MCN Telecom в 2019 году нарастила выручку на 20%
21.03. Day-by-Day, 2016.03.19-20, выходные. Дайджест Телеком и Роботы
19.07. Семейство роботов-собеседников пополнит Buddy
23.04.
Персональный робот
23.04.
Каталог роботов по-названиям
26.09. социальный робот
26.08. робот-собеседник
24.06. персональный помощник
23.05. Домашний робот
15.07.
Итоги недели: Все самое интересное с 8 по 14 июля 2013 года
12.01.
Итоги 2011: события и тренды
05.09.
Итоги недели: Все самое интересное с 22 по 28 августа 2011 года
30.08.
Samsung представляет новую мобильную платформу bada 2.0 и SDK под нее
30.08. Кратко о новинках, слухах, анонсах
07.01.
Словарные статьи, начинающиеся на букву Р (кир.)
05.01.
Google Nexus One объявлен официально
14.02. "Мир Call-центров" откроется 20 марта
27.01.
Имиджевый и умный
[Распознавание речи. Устройства для людей с ограниченными возможностями]
В «Сколково» появятся «умные» гаджеты для общения с глухими и слепоглухими людьми
Пресс-релиз, 07.12.2021, через MForum.ru. Устройство распознавания речи «Чарли» тестируют в новой лаборатории клиентского опыта Почты России в Технопарке «Сколково». «Чарли» позволяет разговаривать с глухими и слепоглухими без помощи сурдопереводчиков.
С помощью алгоритмов искусственного интеллекта «Чарли» распознает речь и моментально выводит ее в виде текста на экран любого подключенного устройства (планшета, компьютера или смартфона). Таким образом, неслышащий может легко прочитать то, что ему говорят. Для общения со слепоглухими к гаджету подключается дисплей Брайля, и у человека с нарушениями слуха и зрения появляется возможность прочитать информацию пальцами и ввести ответ. Устройство распознавания речи «Чарли» разработали в московской Лаборатории «Сенсор-Тех», которая специализируется на создании «умных» технологий для людей с инвалидностью (резидент Фонда «Сколково»).
«Чарли» уже используют в МФЦ, университетах, поликлиниках, аптеках, центрах занятости и в других общественных местах. Теперь устройство тестируют в лаборатории клиентского опыта Почты России в «Сколково». Это новая зона пилотирования инновационных услуг для клиентов компании. Формат классического отделения, в котором действует лаборатория, позволит протестировать инновационные решения сразу в реальных условиях бизнес-процессов Почты.
«Пойти куда-то по делам без сопровождения – настоящая проблема, с которой ежедневно сталкиваются глухие и, тем более, слепоглухие. Им сложно общаться с людьми, многие просто не знают, как это сделать, как понять их ответ на обращение. Зачастую дискомфорт испытывают и слышащие люди, которым нужно что-то объяснить глухому. «Чарли» решает эти проблемы для обеих сторон. Гаджет помогает выстраивать диалог, дает возможность общаться с помощью "субтитров", в которые он мгновенно переводит речь», - сказал Денис Кулешов, директор Лаборатории «Сенсор-Тех».
Большинство устройств и приложений, которые распознают речь, созданы для «общения» человека с компьютером, а не для прямого диалога между людьми. «Чарли» - единственный в России гаджет с использованием традиционного рельефного шрифта Брайля, с помощью которого можно коммуницировать со слепоглухими.
«В нашей новой лаборатории мы планируем тестировать не только решения, которые расширяют список наших услуг или трансформируют их, но и такие устройства как «Чарли». В будущем такие проекты помогут повысить доступность сервисов компании для клиентов с особыми возможностями здоровья», – отметил Никита Жучков, руководитель офиса открытых инноваций Почты России.
В 2020 году, когда многие стали учиться и работать в удаленном режиме, «Чарли» получил специальную функцию дистанционного общения. Например, преподаватель в институте может положить гаджет рядом с собой во время лекции, а студенты с нарушением слуха, подключившись к программе по специальной ссылке, будут читать расшифрованную речь лектора дома, на экране смартфона или компьютера, в режиме онлайн.
Таким же образом можно проводить рабочие встречи, совещания, любые образовательные мероприятия или выступления. Для этого необходим лишь доступ к Интернету.
Справочная информация
АНО «Лаборатория «Сенсор-Тех» была основана в 2016 году при поддержке «Фонда поддержки слепоглухих «Со-единение». Цель проекта – разработка технологических решений для социализации людей с нарушениями слуха и зрения, в том числе слепоглухих, в России. Тематика исследований и разработок Лаборатории охватывает широкий спектр направлений науки и техники, в том числе биоинженерию, биотехнические системы, наноэлектронику и электротехнику, информационно-коммуникационные системы, неврологию и нейрофизиологию, генетику. Среди проектов Лаборатории «Сенсор-Тех»: офтальмологический VR-симулятор See My World, имитирующий различные нарушения зрения; приложение «Определитель купюр» для незрячих; умный помощник «Робин» и устройство для распознавания речи «Чарли». В 2017 году Лаборатория «Сенсор-Тех» участвовала в проведении первых в России операций по установке бионического импланта людям с нарушенным зрением. В 2019 году «Сенсор-Тех» стала резидентом Фонда «Сколково». В 2021 году компания представила первый в России нейроимплант, который вернет зрение тотально слепым людям. Сайт компании:
24.04. Производство фоторезистов в Японии оказалось под угрозой из-за энергокризиса
24.04. Cisco представила универсальный квантовый коммутатор для будущего квантового интернета
24.04. «Билайн бизнес» внедрил LLM-агента на горячей линии «Ренессанс страхование»
24.04. Почему в России растет зарубежный трафик?
24.04. Рикор выпустил обновления прошивки для смартфонов Rikor
24.04. МТС в Иркутской области - покрытие расширено поддержкой LTE900 на трассе «Байкал»
21.04. Сделка на миллиард - американцы купили израильский стартап DustPhotonics
21.04. Билайн в Оренбургской области - покрытие 4G расширено новыми базовыми станциями в шести селах
21.04. Как будет меняться ландшафт российских дата-центров в ближайшие годы
21.04. МТС в Забайкальском крае - сеть LTE запущена в сёлах Савво-Борзя и Верхний Тасуркай
21.04. МегаФон в Ханты-Мансийском автономном округе - сеть LTE расширена новым оборудованием в Сургуте
20.04. В ГИСП появился новый отечественный малопотребляющий микроконтроллер К1890КП018
20.04. США заблокировали китайско-европейскую сделку в области полупроводников
24.04. Honor 600 и 600 Pro – 200 МП камера, IP69K и дизайн в стиле iPhone 17 Pro
24.04. Poco M8s 5G – 7000 мАч, 144 Гц и Snapdragon 6s Gen 3 за $189
24.04. iPhone 18 получит дисплей M12+, как у iPhone 14 Pro, а Pro-версии — новый M16
23.04. OnePlus Watch 4 – титановый корпус, Wear OS 6 и 16 дней работы
23.04. Motorola Edge 70 Pro – 6500 мАч, 90 Вт, три 50 МП камеры и защита IP69
23.04. Oppo Find X9 Ultra – двойной 200 МП перископ, 10x оптический зум и Hasselblad
22.04. Redmi K90 Max – первый смартфон Xiaomi со встроенным вентилятором и Dimensity 9500
22.04. Redmi Pad 2 SE 4G – дисплей 9.7"/2K@120 Гц и АКБ 7600 мАч за 205 долларов
22.04. Tecno Pop X 5G – горизонтальная камера, 6500 мАч с 45 Вт и FreeLink за 15 999 рупий
21.04. Huawei Pura 90 – асимметричная камера, АКБ 6500 мАч и Kirin 9010S за 4699 юаней
21.04. Huawei Pura 90 Pro и Pro Max – 200 МП перископ, LOFIC-матрица и двухцветный металл
21.04. Huawei Pura X Max – раскладной смартфон с Kirin 9030 Pro
21.04. Huawei Watch FIT 5 Pro – 1.92" LTPO AMOLED 3000 нит, ECG и датчик глубины
20.04. Sony Xperia 1 VIII получит квадратную камеру вместо вертикальной полоски
20.04. OnePlus Buds Ace 3 обеспечат 55 дБ шумоподавления и 54 часа работы
20.04. OnePlus Pad 4 получил Snapdragon 8 Elite Gen 5, 13.2" 3.4K 144 Гц и батарею 13 380 мАч
17.04. OnePlus Nord CE 6 Lite – Dimensity 7400, 7000 мАч, а AMOLED заменили на LCD
17.04. Oppo Reno16 Pro получит камеру 200 МП, перископ, Dimensity 9500s и батарея 7000+ мАч
16.04. Vivo T5 Pro – 9020 мАч, 90 Вт, IP69 и Snapdragon 7s Gen 4 от 29 999 рупий
16.04. Oppo F33 и F33 Pro – ребрендинг с AMOLED, 7000 мАч и IP69K