Искусственный интеллект: MTS AI перенесла в облако процесс обучения и инференса моделей ИИ

MForum.ru

Искусственный интеллект: MTS AI перенесла в облако процесс обучения и инференса моделей ИИ

14.05.2025, MForum.ru


Компания утверждает, что это позволило ускорить запуск продуктов и сэкономить более 1 млрд рублей инвестиций в собственную инфраструктуру.

MTS AI - один из центров компетенций в области ИИ в России. Компания разрабатывает продукты и решения на базе генеративного ИИ, технологии обработки естественного языка и компьютерного зрения. Среди сервисов компании: AI-сервис речевой аналитики — WordPluse, платформа синтеза и распознавания речи на базе нейронных сетей и методов машинного обучения — Audiogram, сервис генерации и автодополнения кода для оптимизации процесса разработки — Kodify, а также голосовые и текстовые ассистенты для автоматизации коммуникации бизнеса с клиентами.

В основе практически всех сервисов компании лежат ML-модели. Они обучаются на данных, объемы которых могут достигать тысяч ТБ. Для ускорения обучения моделей компания применяет GPU. Закупка соответствующего оборудования требует серьезных инвестиций в инфраструктуру. MTS AI предпочла перенести обучение в облако. Теперь ML-платформа для обучения ключевых моделей компании развернута на виртуальной инфраструктуре. Уже обученные модели продолжают инференс в облаке, это, кстати, упрощает их обслуживание.

Для решения сложных задач, клиенты MTS AI могут использовать услуги компании, основанные на использовании LLM (больших языковых моделей). Это LLM для работы с текстами, а также поиска и анализа информации - Cotype и ее облегченная версия - Cotype Nano, on-premise сервис генерации и автодополнения кода для оптимизации процесса разработки - Kodify.

Обучение LLM еще более затратная и сложная задача, чем работа с ML-моделями. Если обучать и дообучать LLM на GPU потребительского уровня - на это уйдет много времени (и энергии). Для ускорения этого процесса в несколько десятков раз MTS AI использует суперкомпьютер МТС GROM.

Работу с моделями ИИ в облаке можно разделить на 3 этапа:

  • На первом этапе - деплой и предобучение;
  • На втором - глубокое обучение на суперкомпьютере (некоторые нейросети проходят дообучение на VI с GPU. Не совсем понял, что здесь имеется в виду под VI -Variational Inference? - в этом случае, конечно, без GPU не обойтись. Или речь о Virtual Infrastructure?);
  • На третьем этапе - модели переходят на инференс, который происходит в облаке MWS

 

«Для работы с моделями искусственного интеллекта требуется большое количество различного оборудования. Чем больше моделей вы внедряете, тем оно разнообразнее. Для более простых моделей нужны более слабые карты, для более мощных — более производительные, для обучения LLM — суперкомпьютер, для инференса может применяться ещё один вид GPU. При работе с моделями on-prem все эти мощности пришлось бы закупать самостоятельно либо работать со всеми моделями на одном виде GPU, что привело бы к значительному увеличению инвестиционных затрат или нерациональному использованию инфраструктуры. Переезд в облако позволяет нам использовать ровно тот объём вычислительных ресурсов, который необходим и не тратить огромные суммы на закупку серверов. Лишь для того, чтобы закупить оборудование для обучения LLM, нам пришлось бы проинвестировать в инфраструктуру более миллиарда рублей. А благодаря использованию мощностей MWS мы можем перераспределить инвестиции на новые проекты. Кроме того, облачная модель потребления позволяет нам ускорять запуск новых продуктов, так как отпадает необходимость ждать поставки оборудования», — отметил директор по LLM-продуктам MTS AI Сергей Пономаренко.

--

За новостями телекома и IT удобно следить в телеграм-канале abloud62. Региональные новости и анонсы пресс-релизов вы найдете в канале abloudRealTime, также подключайтесь к каналу Бойко про телеком ВКонтакте

теги: МТС MWS искусственный интеллект

-- 

© Алексей Бойко, MForum.ru


Публикации по теме:

12.03. Yandex B2B Tech объявил об итогах работы за 2025 год

06.03. В GSMA говорят о необходимости срочного глобального регулирования низкоорбитальных группировок

06.03. China Mobile представила на MWC2026 маршрутизатор 115,2 Тбит/с для соединения ИИ-кластеров и технологию GSE-DCI

05.03. Китайские операторы и GSMA запускают инициативу Mobile AI Innovation

05.03. Билайн назвал главные тренды развития ИИ-агентов в России

04.03. Nvidia готовит процессор для инференса на базе технологий Groq, OpenAI станет якорным клиентом

04.03. Нейросетевой кодек NESC обещает эпоху массовой спутниковой связи

04.03. Ericsson показала работу сети 6G в условиях лаборатории в США

02.03. Nokia, Samsung, MSI хотят интегрировать ИИ в RAN, а Nvidia хочет в телеком – просматривается кейс win-win

24.02. Американская Anthropic заявила, что ряд китайских ИИ-компаний незаконно использовали модель Claude для улучшения собственных систем

19.02. Компания Humain вкладывает $3 млрд в xAI

18.02. Компания Adani Enterprises заявила, что инвестирует в ЦОДы, готовые к ИИ, $100 млрд к 2035 году

10.02. Cadence представляет ИИ-агента для проектирования чипов

10.02. Сбербанк может вложить в создание нового суперкомпьютера до 0.5 трлн

05.02. Вирусный ИИ-агент OpenClaw и проблемы автономии

05.02. Amazon MGM Studios - ИИ выходит на съёмочную площадку

05.02. Google ставит на кон $185 млрд - инвестиции в ИИ-инфраструктуру удваиваются

03.02. В Yadro успешно протестировали GigaChat на новых ИИ-серверах собственной разработки

03.02. SpaceX намеревается создать распределенный ИИ на орбитах о 500 до 2000 км

02.02. TrendForce прогнозирует, что цены на микросхемы памяти в 1q2026 вырастут на 90-95% к 4q2025

Обсуждение (открыть в отдельном окне)

В форуме нет сообщений.

Новое сообщение:
Complete in 2 ms, lookup=0 ms, find=2 ms

Последние сообщения в форумах

Все форумы »



Поиск по сайту:


Колонка редактора

21.04. Сделка на миллиард - американцы купили израильский стартап DustPhotonics

21.04. Билайн в Оренбургской области - покрытие 4G расширено новыми базовыми станциями в шести селах

21.04. Как будет меняться ландшафт российских дата-центров в ближайшие годы

21.04. МТС в Забайкальском крае - сеть LTE запущена в сёлах Савво-Борзя и Верхний Тасуркай

21.04. МегаФон в Ханты-Мансийском автономном округе - сеть LTE расширена новым оборудованием в Сургуте

20.04. В ГИСП появился новый отечественный малопотребляющий микроконтроллер К1890КП018

20.04. США заблокировали китайско-европейскую сделку в области полупроводников

20.04. Аналитики прогнозируют расширение фокуса спроса с GPU на CPU и память из-за распространения агентного ИИ

20.04. New Glenn 3 не вывезла… спутник BlueBird 7 потерян

20.04. Китайские лидары научили различать цвета

20.04. Ростов-на-Дону может остаться совсем без мобильной связи?

20.04. Встречи. "Телеком будущего". Часть 1

20.04. И вновь об IMEI

20.04. MWS Cloud запустила Managed Kafka в промышленную эксплуатацию

19.04. 6G - Samsung и Orange высказывают обоснованный скепсис в отношении нового "жэ"

Все статьи >>


Новости

23.04. OnePlus Watch 4 – титановый корпус, Wear OS 6 и 16 дней работы

23.04. Motorola Edge 70 Pro – 6500 мАч, 90 Вт, три 50 МП камеры и защита IP69

23.04. Oppo Find X9 Ultra – двойной 200 МП перископ, 10x оптический зум и Hasselblad

22.04. Redmi K90 Max – первый смартфон Xiaomi со встроенным вентилятором и Dimensity 9500

22.04. Redmi Pad 2 SE 4G – дисплей 9.7"/2K@120 Гц и АКБ 7600 мАч за 205 долларов

22.04. Tecno Pop X 5G – горизонтальная камера, 6500 мАч с 45 Вт и FreeLink за 15 999 рупий

21.04. Huawei Pura 90 – асимметричная камера, АКБ 6500 мАч и Kirin 9010S за 4699 юаней

21.04. Huawei Pura 90 Pro и Pro Max – 200 МП перископ, LOFIC-матрица и двухцветный металл

21.04. Huawei Pura X Max – раскладной смартфон с Kirin 9030 Pro

21.04. Huawei Watch FIT 5 Pro – 1.92" LTPO AMOLED 3000 нит, ECG и датчик глубины

20.04. Sony Xperia 1 VIII получит квадратную камеру вместо вертикальной полоски

20.04. OnePlus Buds Ace 3 обеспечат 55 дБ шумоподавления и 54 часа работы

20.04. OnePlus Pad 4 получил Snapdragon 8 Elite Gen 5, 13.2" 3.4K 144 Гц и батарею 13 380 мАч

17.04. OnePlus Nord CE 6 Lite – Dimensity 7400, 7000 мАч, а AMOLED заменили на LCD

17.04. Oppo Reno16 Pro получит камеру 200 МП, перископ, Dimensity 9500s и батарея 7000+ мАч

16.04. Vivo T5 Pro – 9020 мАч, 90 Вт, IP69 и Snapdragon 7s Gen 4 от 29 999 рупий

16.04. Oppo F33 и F33 Pro – ребрендинг с AMOLED, 7000 мАч и IP69K

16.04. Poco C81 Pro получи 6.9" дислеей 120 Гц, АКБ 6000 мАч и Unisoc T7250

15.04. Motorola Razr 70 Ultra получит Snapdragon 8 Elite и батарею на 6% больше

15.04. Tecno Spark 50 4G – Helio G81, 7000 мАч и связь без сети за 1.5 км