MForum.ru
12.08.2025,
MWS Cloud (входит в МТС Web Services) запустило платформу Inference Valve, позволяющую внедрять и эксплуатировать модели AI. В частности, можно выводить в продакшн любые обученные ML-модели, большие языковые модели (LLM), модели компьютерного зрения (CV).
Развернув модели можно их подключать к IT-системам компании через стандартные API, масштабировать, обновлять и мониторить. Платформа должна обеспечить сокращение времени внедрения моделей в бизнес-процессы, существенно снизить операционную нагрузку на команды за счет автоматизации рутины - от упаковки модели до ее сопровождения.
С этим запуском MWS Cloud вышла на рынок платформ для инференса AI моделей, размер этого рынка оценивают более, чем в 15 млрд рублей.
С помощью платформы CV-модели могут автоматически анализировать видео, находя определенные объекты, сцены и действия или классифицировать медицинские изображения. ML- и LLM-модели смогут генерировать и структурировать тексты, анализировать данные, создавать их описание, прогнозировать показатели маркетинга и продаж, отвечать на часто задаваемые вопросы в HR-порталах. Также на платформе можно разворачивать голосовые модели для синтеза и анализа речи, а также внедрения их в колл-центры.
Компании могут развернуть как собственные обученные AI-модели, так и воспользоваться готовыми к работе опенсорсными моделями. Кроме того, Inference Valve интегрируется с ML-платформой и инструментами непрерывной разработки (CI/CD), что позволяет выстроить бесшовный процесс от обучения ИИ до его внедрения в бизнес-процессы и непрерывного обновления.
Платформа доступна в частном облаке на инфраструктуре MWS Cloud, on-prem на серверах заказчика, а также в составе программно-аппаратных комплексов (ПАК) в закрытом контуре, включая режимы с ограниченным доступом к внешним сетям.
После запуска кластера специалисты заказчика загружают артефакты модели (например, ONNX, TorchScript) в платформу, после чего она автоматически формирует контейнер сервиса и публикует эндпоинт. Платформа поддерживает одновременную работу сразу с несколькими моделями с выделением квот вычислительных ресурсов, управление версиями, маршрутизацию трафика между версиями и масштабирование под нагрузку как на GPU, так и на CPU.
Inference Valve также предоставляет метрики задержек и пропускной способности, мониторинг доступности, алёрты и дашборды; доступна телеметрия качества, включая отслеживание дрейфа данных и моделей, контроль целевых метрик и уведомления при деградации. Интеграция с системами наблюдаемости (Prometheus/Grafana) и журналированием запросов упрощает аудит и разбор инцидентов.
«Без активного внедрения искусственного интеллекта практически невозможно рассчитывать на лидерство на рынке. Только в MWS Cloud спрос на инфраструктуру для ИИ за год вырос в два раза. При этом недостаточно просто обучить AI-модель. Её ещё нужно интегрировать в бизнес-процессы компании, наладить её бесперебойную работу, отслеживать успешность её работы. Inference Valve позволяет сделать это из коробки с помощью нескольких простых команд. С её помощью LLM и CV-модели в десятки раз быстрее интегрируются с ИТ-системами компании, операционная нагрузка на ML-команды при эксплуатации моделей снижается на 70%, степень автоматизации CI/CD повышается более чем на треть, а затраты на GPU снижаются более чем на 15%», — отметил CEO MWS Cloud, исполнительный директор МТС Web Services Игорь Зарубинский.
--
За новостями телекома и IT удобно следить в телеграм-канале abloud62. Региональные новости и анонсы пресс-релизов вы найдете в канале abloudRealTime, также подключайтесь к каналу Бойко про телеком ВКонтакте
теги: искусственный интеллект цифровые платформы облачные услуги MWS МТС
--
Публикации по теме:
01.09. [Новости компаний] IT. Облачные сервисы: MWS Cloud в 1,5 раза увеличила мощности GPU-облака для искусственного интеллекта / MForum.ru
14.01. [Новости компаний] Искусственный интеллект: B2B: МТС Web Services запустила сервис для безопасной работы ИИ с персональными данными / MForum.ru
06.12. [Новости компаний] ЦОД: МТС Web Services сообщает о начале работ по расширению мощностей ЦОД GreenBuschDC / MForum.ru
28.08. [Новости компаний] Искусственный интеллект: МТС запустила еще 2 кластера на базе GPU для облачного ИИ / MForum.ru
09.08. [Новости компаний] Искусственный интеллект: МТС Web Services запустил в Санкт-Петербурге GPU-облако для обучения ИИ / MForum.ru
27.01. [Новинки] Слухи: Oppo Find X9s получит двойную 200 МП камеру в компактном корпусе / MForum.ru
27.01. [Новинки] Анонсы: HMD Watch X1 и P1 — смарт-часы для тех, кому не нужен смартфон на запястье / MForum.ru
26.01. [Новинки] Слухи: Infinix готовит анонс Smart 20 с Android 16 и АКБ 5100 мАч / MForum.ru
26.01. [Новинки] Это интересно: 200 Мп сенсоры в 2026: от массового хита до эксклюзивного флагмана / MForum.ru
26.01. [Новинки] Слухи: TENAA раскрыла дизайн и характеристики Samsung Galaxy A57 / MForum.ru
23.01. [Новинки] Анонсы: Представлен Realme Neo8 с батареей 8000 мАч, 3.5x перископом и ценой от $370 / MForum.ru
23.01. [Новинки] Слухи: Samsung Galaxy S26 выйдут в Корее 11 марта, Unpacked назначен на 25 февраля / MForum.ru
22.01. [Новинки] Анонсы: Nubia RedMagic 11 Air – самый тонкий в мире игровой телефон с вентилятором и батареей на 7000 мАч / MForum.ru
22.01. [Новинки] Слухи: OnePlus 16 прочат батарею 9000 мАч и 200-мегапиксельный перископ / MForum.ru
22.01. [Новинки] Анонсы: Oppo представляет Reno 15 FS для Европы / MForum.ru
21.01. [Новинки] Анонсы: Honor Watch GS 5 – 23-дневная батарея и скрининг сердца за $100 / MForum.ru
21.01. [Новинки] Слухи: Motorola готовит Edge 70 Fusion с батареей на 7000 мАч и экраном яркостью 5200 нит / MForum.ru
21.01. [Новинки] Слухи: Samsung Galaxy A57 засветился в TENAA / MForum.ru
20.01. [Новинки] Анонсы: Infinix представляет Note Edge с премиальным дизайном и очень ярким дисплеем / MForum.ru
20.01. [Новинки] Анонсы: Lava Blaze Duo 3 — эксперимент с двумя экранами и актуальным железом / MForum.ru
20.01. [Новинки] Слухи: iQOO 15 Ultra может получитть 200-ваттную зарядку и выиграть гонку автономности / MForum.ru
19.01. [Новинки] Анонсы: Tecno представила Spark Go 3 за $99 с экраном 120 Гц и ИИ-помощником / MForum.ru
19.01. [Новинки] Слухи: Realme работает над P4 Power с батареей на 10 000 мАч / MForum.ru
19.01. [Новинки] Слухи: Galaxy S27 Ultra готовится стать главным прорывом Samsung за пять лет / MForum.ru
16.01. [Новинки] Анонсы: iQOO представила в Китае Z11 Turbo с чипом 3 нм и батареей будущего / MForum.ru