MForum.ru
23.01.2023,
МТС сообщает о смелом решении озвучить до 10 тысяч произведений с помощью искусственного интеллекта MTS AI. Аудиокниги в рамках этого проекта будут доступны пользователям книжного сервиса "Строки". Будет задействована собственная разработка для распознавания и синтеза речи Audiogram. В этом продукте объединены возможности использования нейронных сетей, технологии ML обработки естественного языка (NLP).
Аудиопроизведения будут сформированы в формате EPUB - формат популярный в области цифровых книг, а вот для сохранения звука его использовали не так часто.
Картинка нарисована с использованием нейросети DALL.E 2 и сервиса Nightcafe.
Надеюсь платформа МТС озвучивает тексты лучше, чем эта платформа рисует картинки.
“В перспективе использование технологий синтеза речи позволит издательствам и электронным библиотекам существенного сократить время на подготовку аудиоверсии книги и снизить затраты на производство аудиоконтента. Команде MTS AI удалось добиться того, чтобы на подготовку первоначальной версии аудиокниг уходило 30-60 минут, тогда как студийная запись живым голосом занимает кратно больше времени, до нескольких дней с учетом технической обработки и монтажа”, - Дмитрий Буланцев, технический директор MTS AI.
“Формат аудиопотребления книжного контента очень удобен и становится все более популярным. При этом огромный объем книг - более 90% - не озвучены, их трансформация в аудиоформат традиционным способом заняла бы годы. Технологии искусственного интеллекта позволяют существенно ускорить, упростить и удешевить этот процесс. И значит огромное число произведений - как литературных, так и нонфикшн станут доступным в удобном аудиоформате,” - комментирует Евгения Рыкалова, руководитель книжного сервиса "Строки" от МТС.
МТС обещает, что платформа не только синтезирует речь, но также правильно расставляет ударения и паузы, воспроизводит побудительные и вопросительные интонации. Вместе с тем, я не думаю, что даже лучшие алгоритмы уже сегодня способны убить такой жанр как озвучивание книг. Оплачиваемые заказы на этом рынке получить будет сложнее, но работы мастеров этого жанра будут продолжать пользоваться спросом.
В МТС ожидают, что платформу Audiogram можно будет задействовать не только для озвучки книг, но также в образовании, для подготовки аудиолекций, для озвучивания видео, статей, создания материалов для людей с ограниченными возможностями, например, по зрению.
UPD: Послушал примеры работы Audiogram. Выглядит приемлемо, если почему-то предпочтительнее аудиформат. Но вряд ли поклонники тех или иных чтецов будут готовы перейти на такую озвучку. С другой стороны, встречаются и чтецы, которые читают не лучше или хуже (особенно беда с ударениями, а иногда и интонациями). К сожалению, примеры в целом не очень наглядные, например, непонятно, будет ли какая-то раскладка по голосам, когда идет речь о диалогах, например.
Чего точно не хотелось бы, так это того, чтобы дети в большом объеме сталкивались с такими вариантами озвучки, т.к. "чужинка" в озвучке присутствует. И лучше бы детям давать слушать тексты в исполнении профессиональных чтецов или лучших из любителей, а не в исполнении ИИ. По крайней мере, пока что.
Сэмплы доступны в Telegram:
https://t.me/c/1172581942/2238
https://t.me/c/1172581942/2239
--
За новостями телекома и IT удобно следить в телеграм-канале abloud62. Региональные новости и анонсы пресс-релизов вы найдете в канале abloudRealTime, также подключайтесь к каналу Бойко про телеком ВКонтакте
теги: МТС AI ИИ
Публикации по теме:
16.06. МТС сообщает, что каждую третью рекламную кампанию в Telegram запускают на основе Big Data
21.05. МТС отчиталась за 1q2025 - хороший результат для сложных рыночных условий. Часть 2
18.04. Нетелеком-услуги операторов - МТС собирает контент в кластер
06.03. МТС отчиталась за 4q2024 - ростом выручки на фоне сокращения прибыли
22.08. МТС отчиталась за 2q2024 - выручка серьезно выросла
11.07. МТС отчиталась за 1q2024 - на позитиве
05.03. МТС отчиталась за 4q2023
29.02. МегаФон отчитался за 2023 год – заметным ростом показателей
11.05. МТС Travel приобрела права на контент портала "Тонкости туризма"
07.03. Таиланд стал лидером по количеству "зимующих" туристов из России
05.03. МТС отчиталась за 4q2022
01.03. МТС запустила арт-инсталляцию в метро Москвы
10.02. MTS AI
21.12. Книжная платформа "Строки" выпустит сериалы в формате книг
14.12. МТС проведет AR-показ коллекций российских дизайнеров в Москве и Санкт-Петербурге
01.12. МТС и московская подземка "оживят" карты Тройка технологией AR
19.01. AR / VR
01.10. Искусственный интеллект
09.06. Конспекты. Панель Ведомостей. Часть 7. Алексей Корня. Частоты, лицензии, равные права
22.05. МТС отчиталась за 1q2026 - ростом выручки и OIBDA
22.05. T2 начинает подключать БС в Москве с помощью ВОЛС
22.05. Процессоры Иртыш – это «переклеенный» Loongson или собственная разработка?
22.05. Российский ИИ GigaChat планируют перевести на китайские чипы?
21.05. Плату за международный трафик введут позднее
21.05. SpaceX готова к проведению масштабного IPO
21.05. Облачное доверие на ЦИПР-2026: гибридный баланс, государственный пример и контроль от железа до ПО
21.05. Новосибирская компания Элрон представила одноплатник на процессоре Гиперком-У
21.05. Российский ИИ GigaChat планируют перевести на китайские чипы?
21.05. II Всероссийская конференция по печатным платам: время масштабировать прорывы
21.05. Бюро 1440 и Белинтерсат договорились о сотрудничестве
21.05. Yadro и T1 подписали соглашение о сотрудничестве в области инфраструктурных решений
21.05. Verizon: ИИ-атаки стали главной угрозой кибербезопасности в 2025 году
22.05. Poco Pad C1 – доступный планшет с экраном 2K 120 Гц и батареей 7600 мАч
22.05. Утечка раскрыла параметры HMD Thunder Pro – 50 МП с OIS, OLED 90 Гц и 6000 мАч
22.05. HMD Vibe 2 5G – 6000 мАч, 120 Гц и Android 16 от $115
21.05. iQOO 15T – Dimensity 9500 Monster, 8000 мАч, 200 МП и 144 Гц от $558
21.05. Itel A100 Pro дизайн в стиле iPhone 17 Pro за $95 и с Android Go
21.05. Infinix Hot 70 – получит термохромный дизайн и RGB-подсветка
20.05. Moto G37 и G37 Power – Dimensity 6400, 7000 мАч и Android 16 от 145 долларов
20.05. Motorola Edge (2026) получит плоский дизайн вместо изогнутого
20.05. Дизайн Samsung Galaxy A27 показался на рендерах производителей чехлов
19.05. RedMagic 11S Pro и Pro+ получили разогнанный чип, 8000 мАч, вентилятор и IPX8
19.05. Realme 16T с 8000 мАч, IP69 представят 22 мая
19.05. OnePlus Ace 7 – экран 240 Гц, батарея 9000 мАч и охлаждение с вентилятором?
18.05. Vivo Pocket может получить 200 Мп сенсор Sony LYT-901
18.05. 22 мая представят Realme Watch S5 и Buds Air8 Pro с AMOLED 1500 нит, 55dB ANC, LHDC
16.05. Xiaomi 17 Max – 8000 мАч, 200 МП Leica, 6.9" Super Pixel — анонсируют 21 мая
15.05. Представлен Moto Tag 2 с 600 днями работы, UWB и Google Find Hub
15.05. Xiaomi тизерит Band 10 Pro и наушники-клипсы
14.05. Oppo может получить улучшенную квадратную фронталку разрешением 100 МП
14.05. Vivo Y60 – бюджетник с экраном 120 Гц и АКБ 6500 мАч
13.05. Nubia GT Buds – прозрачный дизайн, RGB-подсветка и ANC за $39