Распознавание речи

MForum.ru

Распознавание речи

07.11.2021, MForum.ru


Задачу автоматического распознавания речи стараются решить с помощью ИИ. Достигнуты хорошие результаты, если сравнивать с тем, что получалось делать ранее. Вместе с тем, по состоянию на 2021 года мне не доводилось видеть систем, которые безошибочно распознавали бы диктовку хотя бы на одном языке, не говоря уже о ситуациях со сленгом, активным использовании иностранных слов и технических терминов. Как правило, речь всегда идет о проценте верно расознанных слов и этот процент редко когда доходит до 90%. 

Распознавание речи зависит от качества звукового сигнала.

Различают распознавание в реальном времени и распознавание предварительно записанного звукового файла.

ПО для распознавания может иметь нулевой физический интерфейс, оно может располагаться на вычислительных ресурсах пользователя или в облаке, на платформе соответствующего сервиса. Иногда для устройств распознавания предусматривают физический интерфейс, как, например, в случае с "умными колонками". Впрочем, в ситуациях, когда есть физический интерфейс, как правило, речь идет об устройстве с более развитым функционалом, чем только распознавание, например, также о синтезе речи, анализе распознанной речи и каких-то действиях, которое устройство способно выполнять, ориентируясь на распознанные запросы пользователя. Эти возможности легли в основу голосовых чат-ботов и "умных колонок".

Есть устройства, адресованные инвалидам, например, устройства, которые преобразуют слышимую речь в текст на экране смартфона или компьютера. Впрочем, от возможности "протоколировать" разговоры вряд ли откажутся и многие люди с обычными возможностями. Такие устройства упростили бы жизнь и для тех, кто не слишком хорошо воспринимает на слух речь на иностранном языке, хотя способен понимать написанный на этом языке текст и произносить простые фразы. 

 

Новости

2021.12.07 Устройство распознавания речи «Чарли» компании "Сенсор-Тех" тестируют в новой лаборатории клиентского опыта Почты России в Технопарке «Сколково». «Чарли» позволяет разговаривать с глухими и слепоглухими без помощи сурдопереводчиков. 

 

--

© Алексей Бойко, MForum.ru


Публикации по теме:

17.04. Билайн нарастил долю в Voca-Tech, укрепив позиции на рынке голосовой аналитики

07.03. Билайн Big Data & AI повысил точность распознавания речи в аудиозаписях до 85%

28.01. MCN Telecom в 2019 году нарастила выручку на 20%

21.03. Day-by-Day, 2016.03.19-20, выходные. Дайджест Телеком и Роботы

19.07. Семейство роботов-собеседников пополнит Buddy

23.04.  Персональный робот

23.04.  Каталог роботов по-названиям

26.09. социальный робот

26.08. робот-собеседник

24.06. персональный помощник

23.05. Домашний робот

15.07.  Итоги недели: Все самое интересное с 8 по 14 июля 2013 года

12.01.  Итоги 2011: события и тренды

05.09.  Итоги недели: Все самое интересное с 22 по 28 августа 2011 года

30.08.  Samsung представляет новую мобильную платформу bada 2.0 и SDK под нее

30.08. Кратко о новинках, слухах, анонсах

07.01.  Словарные статьи, начинающиеся на букву Р (кир.)

05.01.  Google Nexus One объявлен официально

14.02. "Мир Call-центров" откроется 20 марта

27.01.  Имиджевый и умный

Обсуждение (открыть в отдельном окне)

07.12.2021 21:07 * От: ABloud

[Распознавание речи. Устройства для людей с ограниченными возможностями]

В «Сколково» появятся «умные» гаджеты для общения с глухими и слепоглухими людьми

Пресс-релиз, 07.12.2021, через MForum.ru. Устройство распознавания речи «Чарли» тестируют в новой лаборатории клиентского опыта Почты России в Технопарке «Сколково». «Чарли» позволяет разговаривать с глухими и слепоглухими без помощи сурдопереводчиков.

С помощью алгоритмов искусственного интеллекта «Чарли» распознает речь и моментально выводит ее в виде текста на экран любого подключенного устройства (планшета, компьютера или смартфона). Таким образом, неслышащий может легко прочитать то, что ему говорят. Для общения со слепоглухими к гаджету подключается дисплей Брайля, и у человека с нарушениями слуха и зрения появляется возможность прочитать информацию пальцами и ввести ответ. Устройство распознавания речи «Чарли» разработали в московской Лаборатории «Сенсор-Тех», которая специализируется на создании «умных» технологий для людей с инвалидностью (резидент Фонда «Сколково»).

«Чарли» уже используют в МФЦ, университетах, поликлиниках, аптеках, центрах занятости и в других общественных местах. Теперь устройство тестируют в лаборатории клиентского опыта Почты России в «Сколково». Это новая зона пилотирования инновационных услуг для клиентов компании. Формат классического отделения, в котором действует лаборатория, позволит протестировать инновационные решения сразу в реальных условиях бизнес-процессов Почты.

«Пойти куда-то по делам без сопровождения – настоящая проблема, с которой ежедневно сталкиваются глухие и, тем более, слепоглухие. Им сложно общаться с людьми, многие просто не знают, как это сделать, как понять их ответ на обращение. Зачастую дискомфорт испытывают и слышащие люди, которым нужно что-то объяснить глухому. «Чарли» решает эти проблемы для обеих сторон. Гаджет помогает выстраивать диалог, дает возможность общаться с помощью "субтитров", в которые он мгновенно переводит речь», - сказал Денис Кулешов, директор Лаборатории «Сенсор-Тех».

Большинство устройств и приложений, которые распознают речь, созданы для «общения» человека с компьютером, а не для прямого диалога между людьми. «Чарли» - единственный в России гаджет с использованием традиционного рельефного шрифта Брайля, с помощью которого можно коммуницировать со слепоглухими.

«В нашей новой лаборатории мы планируем тестировать не только решения, которые расширяют список наших услуг или трансформируют их, но и такие устройства как «Чарли». В будущем такие проекты помогут повысить доступность сервисов компании для клиентов с особыми возможностями здоровья», – отметил Никита Жучков, руководитель офиса открытых инноваций Почты России.

В 2020 году, когда многие стали учиться и работать в удаленном режиме, «Чарли» получил специальную функцию дистанционного общения. Например, преподаватель в институте может положить гаджет рядом с собой во время лекции, а студенты с нарушением слуха, подключившись к программе по специальной ссылке, будут читать расшифрованную речь лектора дома, на экране смартфона или компьютера, в режиме онлайн.

Таким же образом можно проводить рабочие встречи, совещания, любые образовательные мероприятия или выступления. Для этого необходим лишь доступ к Интернету.

Справочная информация

АНО «Лаборатория «Сенсор-Тех» была основана в 2016 году при поддержке «Фонда поддержки слепоглухих «Со-единение». Цель проекта – разработка технологических решений для социализации людей с нарушениями слуха и зрения, в том числе слепоглухих, в России. Тематика исследований и разработок Лаборатории охватывает широкий спектр направлений науки и техники, в том числе биоинженерию, биотехнические системы, наноэлектронику и электротехнику, информационно-коммуникационные системы, неврологию и нейрофизиологию, генетику. Среди проектов Лаборатории «Сенсор-Тех»: офтальмологический VR-симулятор See My World, имитирующий различные нарушения зрения; приложение «Определитель купюр» для незрячих; умный помощник «Робин» и устройство для распознавания речи «Чарли». В 2017 году Лаборатория «Сенсор-Тех» участвовала в проведении первых в России операций по установке бионического импланта людям с нарушенным зрением. В 2019 году «Сенсор-Тех» стала резидентом Фонда «Сколково». В 2021 году компания представила первый в России нейроимплант, который вернет зрение тотально слепым людям. Сайт компании: http://sensor-tech.ru/


Новое сообщение:
Complete in 7 ms, lookup=0 ms, find=7 ms

Последние сообщения в форумах

Все форумы »



Поиск по сайту:


Колонка редактора

15.05. Специалисты по ИБ без опыта работы не нужны почти никому

15.05. Ericsson предупреждает операторов - они упускают возможности, связанные с 5G и ИИ

15.05. Рынок SiC и GaN в Китае демонстрирует интересные тренды

15.05. Прогноз развития телекоммуникационной отрасли России дадут на ЦИПР-2026

15.05. В NASA тестируют процессор нового поколения для использования в условиях космоса

15.05. МегаФон в Хабаровском крае – оператор провел рефарминг частот в сёлах с большим потреблением голосовых услуг

15.05. МТС обеспечила покрытием LTE станцию «Спортивная» в метро Новосибирска

15.05. Билайн в Пермском крае - 4G улучшен в 13 населенных пунктах к дачному сезону

14.05. Монокристалл - в шаге от банкротства?

14.05. Услуги D2D - консолидация вместо конкуренции? В США

14.05. Мировой рынок RAN в 1q2026 остался стабильным пятый квартал подряд

14.05. «Группа Астра» запустила облако Astra Cloud на российских процессорах Baikal-S от «Байкал Электроникс»

14.05. Ускорители ИИ Nvidia в рамках конфликта США и Китая

14.05. В России работают над проектом рентгеновского фотолитографа

14.05. Виктория Морозова назначена директором по маркетингу МТС Web Services

Все статьи >>


Новости

15.05. Представлен Moto Tag 2 с 600 днями работы, UWB и Google Find Hub

15.05. Xiaomi тизерит Band 10 Pro и наушники-клипсы

14.05. Oppo может получить улучшенную квадратную фронталку разрешением 100 МП

14.05. Vivo Y60 – бюджетник с экраном 120 Гц и АКБ 6500 мАч

13.05. Nubia GT Buds – прозрачный дизайн, RGB-подсветка и ANC за $39

13.05. Samsung запускает One UI 9 Beta на базе Android 17, ещё до анонса ОС от Google

13.05. Honor Pad 20 с дисплеем 12.1" 3K, Snapdragon 7 Gen 3 и АКБ 10 100 мАч показали на тизерах

11.05. Huawei Watch Fit 5 и Watch Fit 5 Pro выходят на глобальный рынок

11.05. Acer Iconia iM11 5G – Dimensity 7050, 5G и 7400 мАч за $249

08.05. OnePlus Nord CE6 Lite с 7000 мАч, 144 Гц LCD и Dimensity 7400 Apex представлен официально

08.05. OnePlus Nord CE6 с АКБ 8000 мАч, AMOLED-экраном 144 Гц и Snapdragon 7s Gen 4 представлен официально

07.05. Honor Play 11 Plus – 7000 мАч, 120 Гц AMOLED и Dimensity 6500 Elite за $320

07.05. Honor Play 70C – Helio G81 Ultra, 5300 мАч и Android 15 за $90

06.05. Honor Play 80 Plus – 7500 мАч, Snapdragon 4 Gen 4 и AI-кнопка за $249

06.05. Samsung Galaxy S27 Ultra получит переменную диафрагму в основной камере?

06.05. Samsung Galaxy A27 – круглый вырез камеры, Snapdragon 6 Gen 3 и 12 МП фронталка

05.05. Xiaomi Smart Band 10 Pro – 1.74" AMOLED, алюминиевый корпус и 21 день работы

05.05. iQOO 15T – 200 МП камера, 8000 мАч, 100 Вт и Dimensity 9500

05.05. Lenovo Legion Y70 (2026) – 2K-экран, 8000 мАч и SD 8 Gen 5

04.05. 7 мая представят Huawei Nova 15 Max – 8500 мАч, 50 МП RYYB и AMOLED