Искусственный интеллект: MTS AI перенесла в облако процесс обучения и инференса моделей ИИ

MForum.ru

Искусственный интеллект: MTS AI перенесла в облако процесс обучения и инференса моделей ИИ

14.05.2025, MForum.ru


Компания утверждает, что это позволило ускорить запуск продуктов и сэкономить более 1 млрд рублей инвестиций в собственную инфраструктуру.

MTS AI - один из центров компетенций в области ИИ в России. Компания разрабатывает продукты и решения на базе генеративного ИИ, технологии обработки естественного языка и компьютерного зрения. Среди сервисов компании: AI-сервис речевой аналитики — WordPluse, платформа синтеза и распознавания речи на базе нейронных сетей и методов машинного обучения — Audiogram, сервис генерации и автодополнения кода для оптимизации процесса разработки — Kodify, а также голосовые и текстовые ассистенты для автоматизации коммуникации бизнеса с клиентами.

В основе практически всех сервисов компании лежат ML-модели. Они обучаются на данных, объемы которых могут достигать тысяч ТБ. Для ускорения обучения моделей компания применяет GPU. Закупка соответствующего оборудования требует серьезных инвестиций в инфраструктуру. MTS AI предпочла перенести обучение в облако. Теперь ML-платформа для обучения ключевых моделей компании развернута на виртуальной инфраструктуре. Уже обученные модели продолжают инференс в облаке, это, кстати, упрощает их обслуживание.

Для решения сложных задач, клиенты MTS AI могут использовать услуги компании, основанные на использовании LLM (больших языковых моделей). Это LLM для работы с текстами, а также поиска и анализа информации - Cotype и ее облегченная версия - Cotype Nano, on-premise сервис генерации и автодополнения кода для оптимизации процесса разработки - Kodify.

Обучение LLM еще более затратная и сложная задача, чем работа с ML-моделями. Если обучать и дообучать LLM на GPU потребительского уровня - на это уйдет много времени (и энергии). Для ускорения этого процесса в несколько десятков раз MTS AI использует суперкомпьютер МТС GROM.

Работу с моделями ИИ в облаке можно разделить на 3 этапа:

  • На первом этапе - деплой и предобучение;
  • На втором - глубокое обучение на суперкомпьютере (некоторые нейросети проходят дообучение на VI с GPU. Не совсем понял, что здесь имеется в виду под VI -Variational Inference? - в этом случае, конечно, без GPU не обойтись. Или речь о Virtual Infrastructure?);
  • На третьем этапе - модели переходят на инференс, который происходит в облаке MWS

 

«Для работы с моделями искусственного интеллекта требуется большое количество различного оборудования. Чем больше моделей вы внедряете, тем оно разнообразнее. Для более простых моделей нужны более слабые карты, для более мощных — более производительные, для обучения LLM — суперкомпьютер, для инференса может применяться ещё один вид GPU. При работе с моделями on-prem все эти мощности пришлось бы закупать самостоятельно либо работать со всеми моделями на одном виде GPU, что привело бы к значительному увеличению инвестиционных затрат или нерациональному использованию инфраструктуры. Переезд в облако позволяет нам использовать ровно тот объём вычислительных ресурсов, который необходим и не тратить огромные суммы на закупку серверов. Лишь для того, чтобы закупить оборудование для обучения LLM, нам пришлось бы проинвестировать в инфраструктуру более миллиарда рублей. А благодаря использованию мощностей MWS мы можем перераспределить инвестиции на новые проекты. Кроме того, облачная модель потребления позволяет нам ускорять запуск новых продуктов, так как отпадает необходимость ждать поставки оборудования», — отметил директор по LLM-продуктам MTS AI Сергей Пономаренко.

--

За новостями телекома и IT удобно следить в телеграм-канале abloud62. Региональные новости и анонсы пресс-релизов вы найдете в канале abloudRealTime, также подключайтесь к каналу Бойко про телеком ВКонтакте

теги: МТС MWS искусственный интеллект

-- 

© Алексей Бойко, MForum.ru


Публикации по теме:

23.12. [Новости компаний] Искусственный интеллект: Китайская ByteDance планирует нарастить капитальные затраты в 2026 году с фокусом на чипы ИИ / MForum.ru

23.12. [Новости компаний] Искусственный интеллект: Что сдерживает развитие ИИ в регионах? / MForum.ru

23.12. [Новости компаний] Искусственный интеллект: ФСТЭК внесла в банк данных угроз ИБ риски, связанные с ИИ / MForum.ru

22.12. [Новости компаний] Искусственный интеллект: Билайн представит общероссийский рейтинг ИИ-активности регионов / MForum.ru

22.12. [Новости компаний] Искусственный интеллект. Энергетика: МТС EnergyTool - инструмент выявил 197 тысяч майнинговых ферм в России / MForum.ru

Обсуждение (открыть в отдельном окне)

В форуме нет сообщений.

Новое сообщение:
Complete in 2 ms, lookup=0 ms, find=2 ms

Последние сообщения в форумах

Все форумы »



Поиск по сайту:

Подписка:

Подписаться
Отписаться


Новости

19.02. [Новинки] Анонсы: Google Pixel 10a — Tensor G4, быстрая зарядка и семь лет обновлений по той же цене / MForum.ru

19.02. [Новинки] Анонсы: Infinix Note Edge 5G выходит в Индии с изогнутым AMOLED-экраном яркостью 4500 нит и батареей 6500 мАч / MForum.ru

18.02. [Новинки] Анонсы: Tecno Camon 50 и 50 Pro представлены официально – экран 144 Гц, 3-кратный зум, батарея 6150 мАч и защитой IP69K / MForum.ru

18.02. [Новинки] Анонсы: Lava Bold N2 4G — обновлённый дизайн, улучшенная защита и Android 15 Go за $82 / MForum.ru

18.02. [Новинки] Слухи: Infinix GT 50 Pro засветился на рендерах — карбон, 144 Гц и батарея до 6500 мАч / MForum.ru

17.02. [Новинки] Анонсы: Realme P4 Lite 4G выходит в Индии 20 февраля с батареей 6300 мАч / MForum.ru

17.02. [Новинки] Анонсы: Vivo V60 Lite первым в мире получил Snapdragon 6s 4G Gen 2 и сохраненил батарею 6500 мАч / MForum.ru

17.02. [Новинки] Слухи: Apple тестирует раскладушку iPhone Flip вдобавок к книжному iPhone Fold / MForum.ru

16.02. [Новинки] Слухи: Poco C81 Pro готовится к выходу — 4G, экран 120 Гц и батарея 6000 мАч / MForum.ru

16.02. [Новинки] Анонсы: Honor Pad X8b — неожиданное возвращение через три с половиной года и батареей на 10 100 мАч / MForum.ru

16.02. [Новинки] Анонсы: TECNO POVA Curve 2 5G — 8000 мАч в ультратонком корпусе / MForum.ru

13.02. [Новинки] Анонсы: Honor X6d — глобальная версия Play 60A с улучшенной камерой / MForum.ru

13.02. [Новинки] Анонсы: Lava Yuva Star 3 — сверхбюджетный Android 15 Go с защитой IP64 и чистым ПО / MForum.ru

12.02. [Новинки] Слухи: Samsung подтвердила анонс Galaxy S26 25 февраля, но полные спецификации и цены раскрыты до премьеры / MForum.ru

12.02. [Новинки] Анонсы: Infinix Note 60 Pro — вдохновлен iPhone и Nothing, чип от Qualcomm и батарея 6500 мАч / MForum.ru

12.02. [Новинки] Слухи: Honor 600 Lite засветился в Geekbench с чипом Dimensity 7100 и Android 16 «из коробки» / MForum.ru

11.02. [Новинки] Анонсы: Oppo K14x — эволюция бюджетника с батареей 6500 мАч и зарядкой 45 Вт / MForum.ru

11.02. [Новинки] Слухи: Oppo тестирует батарею ёмкостью 8500 мАч для будущего флагмана / MForum.ru

10.02. [Новинки] Анонсы: itel A100 — бюджетник с 90 Гц дисплеем, защитой по армейскому стандарту и бесплатными звонками без сети / MForum.ru

10.02. [Новинки] Анонс: Samsung Galaxy F70e — доступная новинка с экраном 120 Гц, но на старом «железе» / MForum.ru