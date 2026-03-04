04.03.2026, MForum.ru

На проходящей в эти дни в Барселоне всемирной выставке Mobile World Congress (MWC) 2026 демонстрируют технологию, способная радикально изменить доступность связи.

Германский институт Фраунгофера по интегральным схемам IIS (Fraunhofer IIS) совместно с ключевыми партнерами демонстрирует возможности аудиокодека NESC (от англ. Neural End-2-End Speech Codec), который обещает сделать голосовую связь через спутники такой же привычной и качественной, как и наземные звонки.

Проблема узких каналов и потенциал выигрыша x10

Современные голосовые кодеки, используемые в сетях 4G и 5G (такие как EVS для VoLTE и VoNR), отлично работают на земле, но для спутниковой связи они слишком требовательны к скорости в канале связи. Для обеспечения хорошего качества разговора им требуется не менее 13 килобит в секунду (кбит/с) и выше.

Спутниковые каналы, когда речь идет о прямой сотовой-спутниковой связи, - дело дорогое. Ресурс спутникового «луча» делится на всех пользователей, которые активны на территории, которую луч «засвечивает» в данный момент. Когда пользователей много, то трудно выделить каждому необходимые для него 13 кбит/с. Нужно сужать луч (наращивая количество спутников), либо…

Альтернатива – это применение ИИ. NESC — это кодек нового поколения, построенный на нейросетях. Он позволяет сжимать голос настолько эффективно, что для его передачи требуется всего единицы кбит/с или даже менее 1 кбит/с. Это означает, что в том же «пятне засветки» голосовой связью через спутник смогут воспользоваться уже на N человек, а 10 x N при равной полосе пропускания. Это обещает превращение спутниковой голосовой связи в по-настоящему массовую!

Что показывают в Барселоне?

Fraunhofer и спутниковый оператор Viasat демонстрируют двусторонний голосовой вызов, проходящий через спутник на геостационарной орбите (GEO). Качество разговора, по заявлениям разработчиков, сравнимо с качеством в наземных сетях.

Другой кейс на MWC2026 показывают Viasat и Cubic³ . Автомобиль с использованием платформы Snapdragon Auto 5G Modem-RF и кодека NESC остается на связи и тогда, когда покидает зону покрытия сотовых вышек. Теоретически – в любой точке планеты.

Партнер Fraunhofer, компания Skylo, уже представила голосовой шлюз (Voice Gateway), интегрированный в ее коммерческую сеть. С использованием NESC-кодека этот шлюз позволяет операторам мобильной связи подключать спутниковую голосовую связь к своей существующей инфраструктуре. У Skylo в портфеле уже есть более 8 миллионов активных подключенных устройств и одобрения регуляторов в 36 странах (России в этом списке нет). А вот во многих других странах, в теории, разница между территориями, покрытыми сотовой связью и территориями, где наземного покрытия нет, будет постепенно снижаться.

Что "под капотом" новой технологии?

NESC, как уже было сказано, это нейросетевой кодек для комплексного кодирования речи, построенный на механизме глубокого обучения. В отличие от классических кодеков (например, AMR‑WB, Opus), он заменяет традиционные алгоритмы обработки сигнала на обученные нейронные сети, которые одновременно выполняют все этапы: анализ, сжатие, передачу и реконструкцию аудиосигнала.

В NESC нет традиционных жестких «модулей», таких как фильтры, например. Всю цепочку обработки сигнала берет на себя нейросеть.

Используются слои свёрточных (CNN), рекуррентных (RNN/LSTM) и/или трансформерных архитектур. Модель способна «разбирать» семантику речи, учитывать лингвистические и акустические особенности говорящего. В итоге может достигаться сопоставимое или лучшее качество восприятия в терминах MOS (от англ. Mean Opinion Score) по сравнению с традиционными кодеками. При этом сохраняется естественность интонаций, тембра и эмоциональной окраски голоса.

Из несколько пугающего – нейросетевой декодер может «восстанавливать» не только искаженные, но и полностью потерянные пакеты, опираясь на контекст и выученные паттерны. Здесь впору вспомнить о Т9…, который зачастую пытается заменить неизвестное ему слово на «типовое», что иногда меняет смысл фразы на противоположный, делает вежливое обращение оскорблением и т.п.

Как это работает

Энкодер (нейронка) преобразует входной аудиосигнал в компактное скрытое представление (embedding/latent code).

Квантование сжимает скрытое представление до битового потока с заданным битрейтом (например, 1–4 кбит/с). Для этого могут использоваться векторные квантователи (VQ‑VAE) или скалярные методы.

Опционально может применяться кодирование в канале, добавляя некоторую избыточность для последующей коррекции ошибок.

Декодером также является нейронка, которая восстанавливает (синтезирует) аудиосигнал из квантованного кода. Для повышения естественности звучания могут быть задействованы авторегрессивные или диффузионные механизмы.

Области применения технологии

Далеко выходят за пределы сотово-спутниковой связи. «Ультрасжатие» пригодится и в сетях 5G/6G, благо мы от них ожидаем достаточного вычислительного ресурса.

Подход применим для видеоконференсинга, для архивирования аудио.

Важен он и для подводной связи – там тоже очень узкие и медленные акустические каналы.

В экспериментах с моделями SoundStream и EnCodec достигнут MOS > 4.0, но при 3 кбит/с, что тоже очень круто!

За выигрыш в снижении требований к полосе пропускания сигнала в данном случае предлагается платить, прежде всего, высокими требованиями к вычислительным ресурсам на обеих сторонах. Кроме того, для создания хороших моделей, как всегда, требуются большие хорошо размеченные датасеты. Кто их будет делать для русского языка? Это только основные, есть и другие проблемы, и проблемки. И все же в целом – это выглядит как перспективная и интересная технология и есть немалые шансы, что через какое-то время она начнет воплощаться «в железе». ||

--

теги: горизонты технологий телеком Барселона MWC2026 ИИ искусственный интеллект кодеки NESC нейросетевые кодеки

--