MForum.ru
12.08.2025,
MWS Cloud (входит в МТС Web Services) запустило платформу Inference Valve, позволяющую внедрять и эксплуатировать модели AI. В частности, можно выводить в продакшн любые обученные ML-модели, большие языковые модели (LLM), модели компьютерного зрения (CV).
Развернув модели можно их подключать к IT-системам компании через стандартные API, масштабировать, обновлять и мониторить. Платформа должна обеспечить сокращение времени внедрения моделей в бизнес-процессы, существенно снизить операционную нагрузку на команды за счет автоматизации рутины - от упаковки модели до ее сопровождения.
С этим запуском MWS Cloud вышла на рынок платформ для инференса AI моделей, размер этого рынка оценивают более, чем в 15 млрд рублей.
С помощью платформы CV-модели могут автоматически анализировать видео, находя определенные объекты, сцены и действия или классифицировать медицинские изображения. ML- и LLM-модели смогут генерировать и структурировать тексты, анализировать данные, создавать их описание, прогнозировать показатели маркетинга и продаж, отвечать на часто задаваемые вопросы в HR-порталах. Также на платформе можно разворачивать голосовые модели для синтеза и анализа речи, а также внедрения их в колл-центры.
Компании могут развернуть как собственные обученные AI-модели, так и воспользоваться готовыми к работе опенсорсными моделями. Кроме того, Inference Valve интегрируется с ML-платформой и инструментами непрерывной разработки (CI/CD), что позволяет выстроить бесшовный процесс от обучения ИИ до его внедрения в бизнес-процессы и непрерывного обновления.
Платформа доступна в частном облаке на инфраструктуре MWS Cloud, on-prem на серверах заказчика, а также в составе программно-аппаратных комплексов (ПАК) в закрытом контуре, включая режимы с ограниченным доступом к внешним сетям.
После запуска кластера специалисты заказчика загружают артефакты модели (например, ONNX, TorchScript) в платформу, после чего она автоматически формирует контейнер сервиса и публикует эндпоинт. Платформа поддерживает одновременную работу сразу с несколькими моделями с выделением квот вычислительных ресурсов, управление версиями, маршрутизацию трафика между версиями и масштабирование под нагрузку как на GPU, так и на CPU.
Inference Valve также предоставляет метрики задержек и пропускной способности, мониторинг доступности, алёрты и дашборды; доступна телеметрия качества, включая отслеживание дрейфа данных и моделей, контроль целевых метрик и уведомления при деградации. Интеграция с системами наблюдаемости (Prometheus/Grafana) и журналированием запросов упрощает аудит и разбор инцидентов.
«Без активного внедрения искусственного интеллекта практически невозможно рассчитывать на лидерство на рынке. Только в MWS Cloud спрос на инфраструктуру для ИИ за год вырос в два раза. При этом недостаточно просто обучить AI-модель. Её ещё нужно интегрировать в бизнес-процессы компании, наладить её бесперебойную работу, отслеживать успешность её работы. Inference Valve позволяет сделать это из коробки с помощью нескольких простых команд. С её помощью LLM и CV-модели в десятки раз быстрее интегрируются с ИТ-системами компании, операционная нагрузка на ML-команды при эксплуатации моделей снижается на 70%, степень автоматизации CI/CD повышается более чем на треть, а затраты на GPU снижаются более чем на 15%», — отметил CEO MWS Cloud, исполнительный директор МТС Web Services Игорь Зарубинский.
--
За новостями телекома и IT удобно следить в телеграм-канале abloud62. Региональные новости и анонсы пресс-релизов вы найдете в канале abloudRealTime, также подключайтесь к каналу Бойко про телеком ВКонтакте
теги: искусственный интеллект цифровые платформы облачные услуги MWS МТС
--
Публикации по теме:
01.09. [Новости компаний] IT. Облачные сервисы: MWS Cloud в 1,5 раза увеличила мощности GPU-облака для искусственного интеллекта / MForum.ru
14.01. [Новости компаний] Искусственный интеллект: B2B: МТС Web Services запустила сервис для безопасной работы ИИ с персональными данными / MForum.ru
06.12. [Новости компаний] ЦОД: МТС Web Services сообщает о начале работ по расширению мощностей ЦОД GreenBuschDC / MForum.ru
28.08. [Новости компаний] Искусственный интеллект: МТС запустила еще 2 кластера на базе GPU для облачного ИИ / MForum.ru
09.08. [Новости компаний] Искусственный интеллект: МТС Web Services запустил в Санкт-Петербурге GPU-облако для обучения ИИ / MForum.ru
17.02. [Новинки] Анонсы: Realme P4 Lite 4G выходит в Индии 20 февраля с батареей 6300 мАч / MForum.ru
17.02. [Новинки] Анонсы: Vivo V60 Lite первым в мире получил Snapdragon 6s 4G Gen 2 и сохраненил батарею 6500 мАч / MForum.ru
17.02. [Новинки] Слухи: Apple тестирует раскладушку iPhone Flip вдобавок к книжному iPhone Fold / MForum.ru
16.02. [Новинки] Слухи: Poco C81 Pro готовится к выходу — 4G, экран 120 Гц и батарея 6000 мАч / MForum.ru
16.02. [Новинки] Анонсы: Honor Pad X8b — неожиданное возвращение через три с половиной года и батареей на 10 100 мАч / MForum.ru
16.02. [Новинки] Анонсы: TECNO POVA Curve 2 5G — 8000 мАч в ультратонком корпусе / MForum.ru
13.02. [Новинки] Анонсы: Honor X6d — глобальная версия Play 60A с улучшенной камерой / MForum.ru
13.02. [Новинки] Анонсы: Lava Yuva Star 3 — сверхбюджетный Android 15 Go с защитой IP64 и чистым ПО / MForum.ru
12.02. [Новинки] Слухи: Samsung подтвердила анонс Galaxy S26 25 февраля, но полные спецификации и цены раскрыты до премьеры / MForum.ru
12.02. [Новинки] Анонсы: Infinix Note 60 Pro — вдохновлен iPhone и Nothing, чип от Qualcomm и батарея 6500 мАч / MForum.ru
12.02. [Новинки] Слухи: Honor 600 Lite засветился в Geekbench с чипом Dimensity 7100 и Android 16 «из коробки» / MForum.ru
11.02. [Новинки] Анонсы: Oppo K14x — эволюция бюджетника с батареей 6500 мАч и зарядкой 45 Вт / MForum.ru
11.02. [Новинки] Слухи: Oppo тестирует батарею ёмкостью 8500 мАч для будущего флагмана / MForum.ru
10.02. [Новинки] Анонсы: itel A100 — бюджетник с 90 Гц дисплеем, защитой по армейскому стандарту и бесплатными звонками без сети / MForum.ru
10.02. [Новинки] Анонс: Samsung Galaxy F70e — доступная новинка с экраном 120 Гц, но на старом «железе» / MForum.ru
10.02. [Новинки] Слухи: Vivo X Fold 6 может получить 200 Мп камеру и мультиспектральный сенсор, чтобы стать главным фото-раскладушкой / MForum.ru
09.02. [Новинки] Слухи: новый базовый iPad получит чип A18 и 8 ГБ ОЗУ для поддержки Apple Intelligence / MForum.ru
09.02. [Новинки] Слухи: Samsung Galaxy S26 получит ускоренную беспроводную зарядку, но снова останется без магнитов / MForum.ru
06.02. [Новинки] Слухи: Oppo готовит два разных Find X9s, один для Китая, второй мирового рынка / MForum.ru
06.02. [Новинки] Слухи: опубликованы официальные рендеры Pixel 10a в новом цвете Lavender / MForum.ru