Искусственный интеллект: MTS AI перенесла в облако процесс обучения и инференса моделей ИИ

MForum.ru

Искусственный интеллект: MTS AI перенесла в облако процесс обучения и инференса моделей ИИ

14.05.2025, MForum.ru


Компания утверждает, что это позволило ускорить запуск продуктов и сэкономить более 1 млрд рублей инвестиций в собственную инфраструктуру.

MTS AI - один из центров компетенций в области ИИ в России. Компания разрабатывает продукты и решения на базе генеративного ИИ, технологии обработки естественного языка и компьютерного зрения. Среди сервисов компании: AI-сервис речевой аналитики — WordPluse, платформа синтеза и распознавания речи на базе нейронных сетей и методов машинного обучения — Audiogram, сервис генерации и автодополнения кода для оптимизации процесса разработки — Kodify, а также голосовые и текстовые ассистенты для автоматизации коммуникации бизнеса с клиентами.

В основе практически всех сервисов компании лежат ML-модели. Они обучаются на данных, объемы которых могут достигать тысяч ТБ. Для ускорения обучения моделей компания применяет GPU. Закупка соответствующего оборудования требует серьезных инвестиций в инфраструктуру. MTS AI предпочла перенести обучение в облако. Теперь ML-платформа для обучения ключевых моделей компании развернута на виртуальной инфраструктуре. Уже обученные модели продолжают инференс в облаке, это, кстати, упрощает их обслуживание.

Для решения сложных задач, клиенты MTS AI могут использовать услуги компании, основанные на использовании LLM (больших языковых моделей). Это LLM для работы с текстами, а также поиска и анализа информации - Cotype и ее облегченная версия - Cotype Nano, on-premise сервис генерации и автодополнения кода для оптимизации процесса разработки - Kodify.

Обучение LLM еще более затратная и сложная задача, чем работа с ML-моделями. Если обучать и дообучать LLM на GPU потребительского уровня - на это уйдет много времени (и энергии). Для ускорения этого процесса в несколько десятков раз MTS AI использует суперкомпьютер МТС GROM.

Работу с моделями ИИ в облаке можно разделить на 3 этапа:

  • На первом этапе - деплой и предобучение;
  • На втором - глубокое обучение на суперкомпьютере (некоторые нейросети проходят дообучение на VI с GPU. Не совсем понял, что здесь имеется в виду под VI -Variational Inference? - в этом случае, конечно, без GPU не обойтись. Или речь о Virtual Infrastructure?);
  • На третьем этапе - модели переходят на инференс, который происходит в облаке MWS

 

«Для работы с моделями искусственного интеллекта требуется большое количество различного оборудования. Чем больше моделей вы внедряете, тем оно разнообразнее. Для более простых моделей нужны более слабые карты, для более мощных — более производительные, для обучения LLM — суперкомпьютер, для инференса может применяться ещё один вид GPU. При работе с моделями on-prem все эти мощности пришлось бы закупать самостоятельно либо работать со всеми моделями на одном виде GPU, что привело бы к значительному увеличению инвестиционных затрат или нерациональному использованию инфраструктуры. Переезд в облако позволяет нам использовать ровно тот объём вычислительных ресурсов, который необходим и не тратить огромные суммы на закупку серверов. Лишь для того, чтобы закупить оборудование для обучения LLM, нам пришлось бы проинвестировать в инфраструктуру более миллиарда рублей. А благодаря использованию мощностей MWS мы можем перераспределить инвестиции на новые проекты. Кроме того, облачная модель потребления позволяет нам ускорять запуск новых продуктов, так как отпадает необходимость ждать поставки оборудования», — отметил директор по LLM-продуктам MTS AI Сергей Пономаренко.

--

За новостями телекома и IT удобно следить в телеграм-канале abloud62. Региональные новости и анонсы пресс-релизов вы найдете в канале abloudRealTime, также подключайтесь к каналу Бойко про телеком ВКонтакте

теги: МТС MWS искусственный интеллект

-- 

© Алексей Бойко, MForum.ru


Публикации по теме:

09.06.2026. Данные вместо формул: европейские суперкомпьютеры проигрывают американскому стартапу

08.06.2026. Google готов ежемесячно платить SpaceX около $1 млрд за возможность пользоваться ИИ-вычислительными мощностями

08.06.2026. Платформа Nvidia RTX Spark – ИИ идет на ПК и другие пользовательские устройства

05.06.2026. В Южной Корее призвали технологические компании делиться «избыточной прибылью» от ИИ с поставщиками и сотрудниками

05.06.2026. ИИ в госуправлении – рынок 2025-2035

04.06.2026. ПМЭФ: ГК Yadro и РЖД подписали меморандум о сотрудничестве в сфере ИИ

04.06.2026. Компания Muon Space – еще один претендент на участие в рынке космических ЦОД

04.06.2026. Внедряя ИИ в деятельность компании следует быть прагматичными

04.06.2026. В ЕС спохватились – без ИИ и микросхем не будет и суверенитета

03.06.2026. YouTube вводит автомаркировку ИИ-видео

03.06.2026. Отечественный OpenSource в 2026 году – обзор от аналитиков ICT.Moscow и Мос.Хаба

02.06.2026. Китай координирует и картографирует «чистую» энергетику в национальных масштабах - с помощью ИИ

01.06.2026. МТС Web Services и K2Тех договорились о технологическом партнерстве для развития доверенного генеративного ИИ

29.05.2026. Demand Gen: Google отбирает «пульт» у маркетологов

29.05.2026. Оценка Anthropic выросла почти до $1 трлн, что сделало ее самым дорогим разработчиком ИИ в США

29.05.2026. Vertu Alphafold – самый дорогой складной смартфон года — от 6880 долларов

29.05.2026. Xiaomi 17T и 17T Pro – Leica-камеры, большие батареи и 144 Гц от €749

28.05.2026. Yandex B2B Tech, Selectel и MetaMentor представили модель аренды ИИ-решений для бизнеса

28.05.2026. 6G RAN: что известно и что неизвестно

25.05.2026. От ИИ ожидают кардинальных улучшений работы российской микроэлектроники

Обсуждение (открыть в отдельном окне)

В форуме нет сообщений.

Новое сообщение:
Complete in 1 ms, lookup=0 ms, find=1 ms

Последние сообщения в форумах

Все форумы »



Поиск по сайту:


Колонка редактора

18.06. Google снизила стоимость подписки на Google AI Plus и вступила в гонку ценообразования

18.06. МТС задействовала солнечные панели для резервирования электропитания «узловых» базовых станций сети сотовой связи

18.06. В России начали серийное производство портативных раций стандарта TETRA – МиниКом-АНР-3

18.06. Минпромторг отменил конкурс на изготовление опытных образцов установок для обработки необожженных керамических карт

18.06. Корея делает большую ставку на SiC и GaN – получится ли?

17.06. Билайн организовал переходы в свою сеть для клиентов, у которых не совпадает регион проживания и оформления SIM-карты

17.06. МегаФон и China Telecom запустили новый магистральный канал «Хабаровск-Гонконг»

17.06. Tensordyne привлекает все больше интереса за счет ставки на LNS

17.06. МегаФон расширил инфраструктуру в населенных пунктах Кетовского района Курганской области

17.06. Yadro и Postgres Professional будут сотрудничать в области разработки и производства промышленных ПАК для КИ

17.06. Узбекистан выбирает спутниковую связь от Amazon Leo

16.06. Music v2 - легальная коммерциализация и возможность менять жанр в рамках одного трека

16.06. Европейская Ams Osram в марте 2026 года представила технологию создания оптических межсоединений для систем ИИ

16.06. Росатом создал импортзамещающее производство высокочистых веществ: красного фосфора и оксихлорида фосфора

16.06. Билайн улучшил связь еще в трех деревнях Новгородской области

Все статьи >>


Новости

18.06. Redmi Turbo 5 с АКБ 7540 мАч, Dimensity 8500-Ultra и IP69K дебютировал в Индии

18.06. Tecno Pova 8 Pro 5G с Dimensity 7300, 12 ГБ ОЗУ и 1.5K-экраном засветился в Google Play Console

17.06. Tecno Spark 50 Pro – дизайн в стиле iPhone 17 Pro и защита IP69

17.06. Vivo T5 Lite 5G – бюджетный долгожитель с АКБ 6500 мАч и экраном 120 Гц

17.06. Xiaomi 18 принесет смену порядка выхода, рост цен и следование стратегии Apple

16.06. Honor X70 Pro Max – батарея 8560 мАч и цена от 295 долларов

16.06. Официально раскрыты камеры и дисплеи Vivo X Fold 6

15.06. Moto G Max – 200 МП камера, экран 5000 нит и военная прочность за 490 долларов

15.06. Honor X7e Plus 5G сертифицирован в ОАЭ

12.06. OnePlus Turbo 6X и 6X Pro -доступные «батарейные монстры» для Китая от 220 долларов

11.06. Honor подтвердила 7 лет обновлений для Magic V6 и всей Magic-серии в Европе

11.06. Realme P4R 5G – 8000 мАч, 144 Гц и MIL-STD-810H за 200 долларов

11.06. Honor готовит Win Pad Mini: 8-дюймовый OLED-планшет для геймеров с емкой батареей

10.06. Honor X80 Pro Max – 11 000 мАч, 90 Вт и Snapdragon 6 Gen 5

10.06. Infinix Smart 20 – большой 120-герцовый экран и автономность за 145 долларов

10.06. Apple анонсировала список устройств для iOS 27, macOS 27 Golden Gate и watchOS 27: Intel Mac остаются без поддержки

09.06. Появилась уточненная информация о батарее, зарядке и дисплее Redmi K100 Pro

09.06. Samsung Galaxy Z Flip 8 сохранит региональное разделение чипов — Exynos 2600 vs Snapdragon 8 Elite Gen 5

09.06. Samsung Galaxy S27 Pro будет на уровне Ultra, но без S Pen

08.06. Vivo V70 Lite – почти незаметное обновление с упором на автономность