Искусственный интеллект: MTS AI перенесла в облако процесс обучения и инференса моделей ИИ

MForum.ru

Искусственный интеллект: MTS AI перенесла в облако процесс обучения и инференса моделей ИИ

14.05.2025, MForum.ru


Компания утверждает, что это позволило ускорить запуск продуктов и сэкономить более 1 млрд рублей инвестиций в собственную инфраструктуру.

MTS AI - один из центров компетенций в области ИИ в России. Компания разрабатывает продукты и решения на базе генеративного ИИ, технологии обработки естественного языка и компьютерного зрения. Среди сервисов компании: AI-сервис речевой аналитики — WordPluse, платформа синтеза и распознавания речи на базе нейронных сетей и методов машинного обучения — Audiogram, сервис генерации и автодополнения кода для оптимизации процесса разработки — Kodify, а также голосовые и текстовые ассистенты для автоматизации коммуникации бизнеса с клиентами.

В основе практически всех сервисов компании лежат ML-модели. Они обучаются на данных, объемы которых могут достигать тысяч ТБ. Для ускорения обучения моделей компания применяет GPU. Закупка соответствующего оборудования требует серьезных инвестиций в инфраструктуру. MTS AI предпочла перенести обучение в облако. Теперь ML-платформа для обучения ключевых моделей компании развернута на виртуальной инфраструктуре. Уже обученные модели продолжают инференс в облаке, это, кстати, упрощает их обслуживание.

Для решения сложных задач, клиенты MTS AI могут использовать услуги компании, основанные на использовании LLM (больших языковых моделей). Это LLM для работы с текстами, а также поиска и анализа информации - Cotype и ее облегченная версия - Cotype Nano, on-premise сервис генерации и автодополнения кода для оптимизации процесса разработки - Kodify.

Обучение LLM еще более затратная и сложная задача, чем работа с ML-моделями. Если обучать и дообучать LLM на GPU потребительского уровня - на это уйдет много времени (и энергии). Для ускорения этого процесса в несколько десятков раз MTS AI использует суперкомпьютер МТС GROM.

Работу с моделями ИИ в облаке можно разделить на 3 этапа:

  • На первом этапе - деплой и предобучение;
  • На втором - глубокое обучение на суперкомпьютере (некоторые нейросети проходят дообучение на VI с GPU. Не совсем понял, что здесь имеется в виду под VI -Variational Inference? - в этом случае, конечно, без GPU не обойтись. Или речь о Virtual Infrastructure?);
  • На третьем этапе - модели переходят на инференс, который происходит в облаке MWS

 

«Для работы с моделями искусственного интеллекта требуется большое количество различного оборудования. Чем больше моделей вы внедряете, тем оно разнообразнее. Для более простых моделей нужны более слабые карты, для более мощных — более производительные, для обучения LLM — суперкомпьютер, для инференса может применяться ещё один вид GPU. При работе с моделями on-prem все эти мощности пришлось бы закупать самостоятельно либо работать со всеми моделями на одном виде GPU, что привело бы к значительному увеличению инвестиционных затрат или нерациональному использованию инфраструктуры. Переезд в облако позволяет нам использовать ровно тот объём вычислительных ресурсов, который необходим и не тратить огромные суммы на закупку серверов. Лишь для того, чтобы закупить оборудование для обучения LLM, нам пришлось бы проинвестировать в инфраструктуру более миллиарда рублей. А благодаря использованию мощностей MWS мы можем перераспределить инвестиции на новые проекты. Кроме того, облачная модель потребления позволяет нам ускорять запуск новых продуктов, так как отпадает необходимость ждать поставки оборудования», — отметил директор по LLM-продуктам MTS AI Сергей Пономаренко.

--

За новостями телекома и IT удобно следить в телеграм-канале abloud62. Региональные новости и анонсы пресс-релизов вы найдете в канале abloudRealTime, также подключайтесь к каналу Бойко про телеком ВКонтакте

теги: МТС MWS искусственный интеллект

-- 

© Алексей Бойко, MForum.ru


Публикации по теме:

12.03. Yandex B2B Tech объявил об итогах работы за 2025 год

06.03. В GSMA говорят о необходимости срочного глобального регулирования низкоорбитальных группировок

06.03. China Mobile представила на MWC2026 маршрутизатор 115,2 Тбит/с для соединения ИИ-кластеров и технологию GSE-DCI

05.03. Китайские операторы и GSMA запускают инициативу Mobile AI Innovation

05.03. Билайн назвал главные тренды развития ИИ-агентов в России

04.03. Nvidia готовит процессор для инференса на базе технологий Groq, OpenAI станет якорным клиентом

04.03. Нейросетевой кодек NESC обещает эпоху массовой спутниковой связи

04.03. Ericsson показала работу сети 6G в условиях лаборатории в США

02.03. Nokia, Samsung, MSI хотят интегрировать ИИ в RAN, а Nvidia хочет в телеком – просматривается кейс win-win

24.02. Американская Anthropic заявила, что ряд китайских ИИ-компаний незаконно использовали модель Claude для улучшения собственных систем

19.02. Компания Humain вкладывает $3 млрд в xAI

18.02. Компания Adani Enterprises заявила, что инвестирует в ЦОДы, готовые к ИИ, $100 млрд к 2035 году

10.02. Cadence представляет ИИ-агента для проектирования чипов

10.02. Сбербанк может вложить в создание нового суперкомпьютера до 0.5 трлн

05.02. Вирусный ИИ-агент OpenClaw и проблемы автономии

05.02. Amazon MGM Studios - ИИ выходит на съёмочную площадку

05.02. Google ставит на кон $185 млрд - инвестиции в ИИ-инфраструктуру удваиваются

03.02. В Yadro успешно протестировали GigaChat на новых ИИ-серверах собственной разработки

03.02. SpaceX намеревается создать распределенный ИИ на орбитах о 500 до 2000 км

02.02. TrendForce прогнозирует, что цены на микросхемы памяти в 1q2026 вырастут на 90-95% к 4q2025

Обсуждение (открыть в отдельном окне)

В форуме нет сообщений.

Новое сообщение:
Complete in 2 ms, lookup=0 ms, find=2 ms

Последние сообщения в форумах

Все форумы »



Поиск по сайту:


Колонка редактора

01.04. МТС испытала «летающую базовую станцию» на аэростате в Саратовской области

01.04. Российской частной спутниковой связи выделили частоты - для тестов

25.03. SK Hynix разместила у ASML крупнейший публичный заказ на EUV-оборудование на $8 млрд

25.03. МегаФон в Красноярском крае - покрытие 4G расширено в 16 муниципальных округах

25.03. МТС в Республике Бурятия - мобильный интернет ускорен в курортном поселке Жемчуг

24.03. Норвежский стартап Lace Lithography привлек $40 млн на литографию с атомарным разрешением

24.03. Билайн в Санкт-Петербурге - мобильный интернет оператора в метро признан лучшим по оценкам DMTEL

24.03. Билайн бизнес сообщает о расширении возможностей связи для предпринимателей

24.03. Кризис расползается по цепочке поставок

24.03. TSMC наращивает мощности в США, спрос на чипы высок, а выручка в 2026 году может вырасти на 30%

24.03. МТС в Приморском крае организовал новый трансграничный переход интернет-трафика с China Mobile

24.03. Практика российских бигтехов – только 7-10% пилотных ИИ-проектов 2025 года дошли до полноценного внедрения

24.03. Запущены первые 16 спутников БЮРО 1440

23.03. В России могут начать работы над литографом для техпроцесса 90 нм в 2026 году

23.03. Samsung Electronics вложит рекордные 110 трлн вон

Все статьи >>


Новости

02.04. Oppo K15 Pro – киберпанк-дизайн, активное охлаждение и батарея 7500 мАч

02.04. Рендеры Sony Xperia 1 VIII показывают квадратный блок камер и вырез в экране

02.04. Vivo Pad 6 Pro – 13.2-дюймовый 4K-экран, АКБ 13 000 мАч и Snapdragon 8 Elite Gen 5

01.04. Lava Bold N2 Pro – меньше и дешевле, чем обычный Bold N2

01.04. Утечка раскрывает характеристики HMD Crest 2 Pro

31.03. Vivo X300 Ultra – 200 МП телевик с гиростабилизацией и почти дюймовый 35-мм модуль

31.03. Vivo X300s – 200 МП основная камера, АКБ 7100 мАч и цена от 720 долларов

31.03. Бюджетный Realme Narzo 100 Lite получит 3 конфигурации памяти

30.03. Все iPhone 18 получат уменьшенный Dynamic Island, но рамки останутся прежними

30.03. OnePlus Nord CE6 Lite получит Dimensity 6300, батарея 7000 мАч и цену до 23 000 рупий

27.03. Представлены iQOO Z11 и Z11x – 9050 мАч, 165 Гц и IP69 за 290 долларов

27.03. iPad (2026) получит чисет A18, 8 ГБ RAM и тот же дизайн

26.03. Vivo X300s – 200 МП, перископ, батарея 7100 мАч и защита IP69

26.03. Представлены Samsung Galaxy A57 и A37 с IP68, Exynos 1680 и прежними камерами

25.03. OnePlus 15T – компактный флагман с батареей 7500 мАч, защитой IP69K и экраном 165 Гц

25.03. Samsung Galaxy Z Fold8 – 200 МП, 8-дюймовый экран и батарея 5000 мАч

25.03. Первый тизер Tecno Spark 50 5G раскрывает дизайн новинки

24.03. Huawei Enjoy 90 Plus и Enjoy 90 – Kirin 8000, батареи 6620 мАч и доступные цены

24.03. Huawei Enjoy 90 Pro Max – Kirin 8000, батарея 8500 мАч и экран 120 Гц за 250 долларов

23.03. Redmi 15A 5G – 6300 мАч и 120 Гц за «реальные деньги»