Распознавание речи

MForum.ru

Распознавание речи

07.11.2021, MForum.ru


Задачу автоматического распознавания речи стараются решить с помощью ИИ. Достигнуты хорошие результаты, если сравнивать с тем, что получалось делать ранее. Вместе с тем, по состоянию на 2021 года мне не доводилось видеть систем, которые безошибочно распознавали бы диктовку хотя бы на одном языке, не говоря уже о ситуациях со сленгом, активным использовании иностранных слов и технических терминов. Как правило, речь всегда идет о проценте верно расознанных слов и этот процент редко когда доходит до 90%. 

Распознавание речи зависит от качества звукового сигнала.

Различают распознавание в реальном времени и распознавание предварительно записанного звукового файла.

ПО для распознавания может иметь нулевой физический интерфейс, оно может располагаться на вычислительных ресурсах пользователя или в облаке, на платформе соответствующего сервиса. Иногда для устройств распознавания предусматривают физический интерфейс, как, например, в случае с "умными колонками". Впрочем, в ситуациях, когда есть физический интерфейс, как правило, речь идет об устройстве с более развитым функционалом, чем только распознавание, например, также о синтезе речи, анализе распознанной речи и каких-то действиях, которое устройство способно выполнять, ориентируясь на распознанные запросы пользователя. Эти возможности легли в основу голосовых чат-ботов и "умных колонок".

Есть устройства, адресованные инвалидам, например, устройства, которые преобразуют слышимую речь в текст на экране смартфона или компьютера. Впрочем, от возможности "протоколировать" разговоры вряд ли откажутся и многие люди с обычными возможностями. Такие устройства упростили бы жизнь и для тех, кто не слишком хорошо воспринимает на слух речь на иностранном языке, хотя способен понимать написанный на этом языке текст и произносить простые фразы. 

 

Новости

2021.12.07 Устройство распознавания речи «Чарли» компании "Сенсор-Тех" тестируют в новой лаборатории клиентского опыта Почты России в Технопарке «Сколково». «Чарли» позволяет разговаривать с глухими и слепоглухими без помощи сурдопереводчиков. 

 

--

© Алексей Бойко, MForum.ru


Публикации по теме:

17.04. Билайн нарастил долю в Voca-Tech, укрепив позиции на рынке голосовой аналитики

07.03. Билайн Big Data & AI повысил точность распознавания речи в аудиозаписях до 85%

28.01. MCN Telecom в 2019 году нарастила выручку на 20%

21.03. Day-by-Day, 2016.03.19-20, выходные. Дайджест Телеком и Роботы

19.07. Семейство роботов-собеседников пополнит Buddy

23.04.  Персональный робот

23.04.  Каталог роботов по-названиям

26.09. социальный робот

26.08. робот-собеседник

24.06. персональный помощник

23.05. Домашний робот

15.07.  Итоги недели: Все самое интересное с 8 по 14 июля 2013 года

12.01.  Итоги 2011: события и тренды

05.09.  Итоги недели: Все самое интересное с 22 по 28 августа 2011 года

30.08.  Samsung представляет новую мобильную платформу bada 2.0 и SDK под нее

30.08. Кратко о новинках, слухах, анонсах

07.01.  Словарные статьи, начинающиеся на букву Р (кир.)

05.01.  Google Nexus One объявлен официально

14.02. "Мир Call-центров" откроется 20 марта

27.01.  Имиджевый и умный

Обсуждение (открыть в отдельном окне)

07.12.2021 21:07 * От: ABloud

[Распознавание речи. Устройства для людей с ограниченными возможностями]

В «Сколково» появятся «умные» гаджеты для общения с глухими и слепоглухими людьми

Пресс-релиз, 07.12.2021, через MForum.ru. Устройство распознавания речи «Чарли» тестируют в новой лаборатории клиентского опыта Почты России в Технопарке «Сколково». «Чарли» позволяет разговаривать с глухими и слепоглухими без помощи сурдопереводчиков.

С помощью алгоритмов искусственного интеллекта «Чарли» распознает речь и моментально выводит ее в виде текста на экран любого подключенного устройства (планшета, компьютера или смартфона). Таким образом, неслышащий может легко прочитать то, что ему говорят. Для общения со слепоглухими к гаджету подключается дисплей Брайля, и у человека с нарушениями слуха и зрения появляется возможность прочитать информацию пальцами и ввести ответ. Устройство распознавания речи «Чарли» разработали в московской Лаборатории «Сенсор-Тех», которая специализируется на создании «умных» технологий для людей с инвалидностью (резидент Фонда «Сколково»).

«Чарли» уже используют в МФЦ, университетах, поликлиниках, аптеках, центрах занятости и в других общественных местах. Теперь устройство тестируют в лаборатории клиентского опыта Почты России в «Сколково». Это новая зона пилотирования инновационных услуг для клиентов компании. Формат классического отделения, в котором действует лаборатория, позволит протестировать инновационные решения сразу в реальных условиях бизнес-процессов Почты.

«Пойти куда-то по делам без сопровождения – настоящая проблема, с которой ежедневно сталкиваются глухие и, тем более, слепоглухие. Им сложно общаться с людьми, многие просто не знают, как это сделать, как понять их ответ на обращение. Зачастую дискомфорт испытывают и слышащие люди, которым нужно что-то объяснить глухому. «Чарли» решает эти проблемы для обеих сторон. Гаджет помогает выстраивать диалог, дает возможность общаться с помощью "субтитров", в которые он мгновенно переводит речь», - сказал Денис Кулешов, директор Лаборатории «Сенсор-Тех».

Большинство устройств и приложений, которые распознают речь, созданы для «общения» человека с компьютером, а не для прямого диалога между людьми. «Чарли» - единственный в России гаджет с использованием традиционного рельефного шрифта Брайля, с помощью которого можно коммуницировать со слепоглухими.

«В нашей новой лаборатории мы планируем тестировать не только решения, которые расширяют список наших услуг или трансформируют их, но и такие устройства как «Чарли». В будущем такие проекты помогут повысить доступность сервисов компании для клиентов с особыми возможностями здоровья», – отметил Никита Жучков, руководитель офиса открытых инноваций Почты России.

В 2020 году, когда многие стали учиться и работать в удаленном режиме, «Чарли» получил специальную функцию дистанционного общения. Например, преподаватель в институте может положить гаджет рядом с собой во время лекции, а студенты с нарушением слуха, подключившись к программе по специальной ссылке, будут читать расшифрованную речь лектора дома, на экране смартфона или компьютера, в режиме онлайн.

Таким же образом можно проводить рабочие встречи, совещания, любые образовательные мероприятия или выступления. Для этого необходим лишь доступ к Интернету.

Справочная информация

АНО «Лаборатория «Сенсор-Тех» была основана в 2016 году при поддержке «Фонда поддержки слепоглухих «Со-единение». Цель проекта – разработка технологических решений для социализации людей с нарушениями слуха и зрения, в том числе слепоглухих, в России. Тематика исследований и разработок Лаборатории охватывает широкий спектр направлений науки и техники, в том числе биоинженерию, биотехнические системы, наноэлектронику и электротехнику, информационно-коммуникационные системы, неврологию и нейрофизиологию, генетику. Среди проектов Лаборатории «Сенсор-Тех»: офтальмологический VR-симулятор See My World, имитирующий различные нарушения зрения; приложение «Определитель купюр» для незрячих; умный помощник «Робин» и устройство для распознавания речи «Чарли». В 2017 году Лаборатория «Сенсор-Тех» участвовала в проведении первых в России операций по установке бионического импланта людям с нарушенным зрением. В 2019 году «Сенсор-Тех» стала резидентом Фонда «Сколково». В 2021 году компания представила первый в России нейроимплант, который вернет зрение тотально слепым людям. Сайт компании: http://sensor-tech.ru/


Новое сообщение:
Complete in 7 ms, lookup=0 ms, find=7 ms

Последние сообщения в форумах

Все форумы »



Поиск по сайту:


Колонка редактора

24.04. Производство фоторезистов в Японии оказалось под угрозой из-за энергокризиса

24.04. Cisco представила универсальный квантовый коммутатор для будущего квантового интернета

24.04. «Билайн бизнес» внедрил LLM-агента на горячей линии «Ренессанс страхование»

24.04. Почему в России растет зарубежный трафик?

24.04. Рикор выпустил обновления прошивки для смартфонов Rikor

24.04. Создатели DeepSeek утверждают, что новая версия китайского ИИ обошла ChatGPT и Gemini в существенных тестах

24.04. МТС в Иркутской области - покрытие расширено поддержкой LTE900 на трассе «Байкал»

21.04. Сделка на миллиард - американцы купили израильский стартап DustPhotonics

21.04. Билайн в Оренбургской области - покрытие 4G расширено новыми базовыми станциями в шести селах

21.04. Как будет меняться ландшафт российских дата-центров в ближайшие годы

21.04. МТС в Забайкальском крае - сеть LTE запущена в сёлах Савво-Борзя и Верхний Тасуркай

21.04. МегаФон в Ханты-Мансийском автономном округе - сеть LTE расширена новым оборудованием в Сургуте

20.04. В ГИСП появился новый отечественный малопотребляющий микроконтроллер К1890КП018

20.04. США заблокировали китайско-европейскую сделку в области полупроводников

20.04. Аналитики прогнозируют расширение фокуса спроса с GPU на CPU и память из-за распространения агентного ИИ

Все статьи >>


Новости

24.04. Honor 600 и 600 Pro – 200 МП камера, IP69K и дизайн в стиле iPhone 17 Pro

24.04. Poco M8s 5G – 7000 мАч, 144 Гц и Snapdragon 6s Gen 3 за $189

24.04. iPhone 18 получит дисплей M12+, как у iPhone 14 Pro, а Pro-версии — новый M16

23.04. OnePlus Watch 4 – титановый корпус, Wear OS 6 и 16 дней работы

23.04. Motorola Edge 70 Pro – 6500 мАч, 90 Вт, три 50 МП камеры и защита IP69

23.04. Oppo Find X9 Ultra – двойной 200 МП перископ, 10x оптический зум и Hasselblad

22.04. Redmi K90 Max – первый смартфон Xiaomi со встроенным вентилятором и Dimensity 9500

22.04. Redmi Pad 2 SE 4G – дисплей 9.7"/2K@120 Гц и АКБ 7600 мАч за 205 долларов

22.04. Tecno Pop X 5G – горизонтальная камера, 6500 мАч с 45 Вт и FreeLink за 15 999 рупий

21.04. Huawei Pura 90 – асимметричная камера, АКБ 6500 мАч и Kirin 9010S за 4699 юаней

21.04. Huawei Pura 90 Pro и Pro Max – 200 МП перископ, LOFIC-матрица и двухцветный металл

21.04. Huawei Pura X Max – раскладной смартфон с Kirin 9030 Pro

21.04. Huawei Watch FIT 5 Pro – 1.92" LTPO AMOLED 3000 нит, ECG и датчик глубины

20.04. Sony Xperia 1 VIII получит квадратную камеру вместо вертикальной полоски

20.04. OnePlus Buds Ace 3 обеспечат 55 дБ шумоподавления и 54 часа работы

20.04. OnePlus Pad 4 получил Snapdragon 8 Elite Gen 5, 13.2" 3.4K 144 Гц и батарею 13 380 мАч

17.04. OnePlus Nord CE 6 Lite – Dimensity 7400, 7000 мАч, а AMOLED заменили на LCD

17.04. Oppo Reno16 Pro получит камеру 200 МП, перископ, Dimensity 9500s и батарея 7000+ мАч

16.04. Vivo T5 Pro – 9020 мАч, 90 Вт, IP69 и Snapdragon 7s Gen 4 от 29 999 рупий

16.04. Oppo F33 и F33 Pro – ребрендинг с AMOLED, 7000 мАч и IP69K