MForum.ru
12.08.2025,
MWS Cloud (входит в МТС Web Services) запустило платформу Inference Valve, позволяющую внедрять и эксплуатировать модели AI. В частности, можно выводить в продакшн любые обученные ML-модели, большие языковые модели (LLM), модели компьютерного зрения (CV).
Развернув модели можно их подключать к IT-системам компании через стандартные API, масштабировать, обновлять и мониторить. Платформа должна обеспечить сокращение времени внедрения моделей в бизнес-процессы, существенно снизить операционную нагрузку на команды за счет автоматизации рутины - от упаковки модели до ее сопровождения.
С этим запуском MWS Cloud вышла на рынок платформ для инференса AI моделей, размер этого рынка оценивают более, чем в 15 млрд рублей.
С помощью платформы CV-модели могут автоматически анализировать видео, находя определенные объекты, сцены и действия или классифицировать медицинские изображения. ML- и LLM-модели смогут генерировать и структурировать тексты, анализировать данные, создавать их описание, прогнозировать показатели маркетинга и продаж, отвечать на часто задаваемые вопросы в HR-порталах. Также на платформе можно разворачивать голосовые модели для синтеза и анализа речи, а также внедрения их в колл-центры.
Компании могут развернуть как собственные обученные AI-модели, так и воспользоваться готовыми к работе опенсорсными моделями. Кроме того, Inference Valve интегрируется с ML-платформой и инструментами непрерывной разработки (CI/CD), что позволяет выстроить бесшовный процесс от обучения ИИ до его внедрения в бизнес-процессы и непрерывного обновления.
Платформа доступна в частном облаке на инфраструктуре MWS Cloud, on-prem на серверах заказчика, а также в составе программно-аппаратных комплексов (ПАК) в закрытом контуре, включая режимы с ограниченным доступом к внешним сетям.
После запуска кластера специалисты заказчика загружают артефакты модели (например, ONNX, TorchScript) в платформу, после чего она автоматически формирует контейнер сервиса и публикует эндпоинт. Платформа поддерживает одновременную работу сразу с несколькими моделями с выделением квот вычислительных ресурсов, управление версиями, маршрутизацию трафика между версиями и масштабирование под нагрузку как на GPU, так и на CPU.
Inference Valve также предоставляет метрики задержек и пропускной способности, мониторинг доступности, алёрты и дашборды; доступна телеметрия качества, включая отслеживание дрейфа данных и моделей, контроль целевых метрик и уведомления при деградации. Интеграция с системами наблюдаемости (Prometheus/Grafana) и журналированием запросов упрощает аудит и разбор инцидентов.
«Без активного внедрения искусственного интеллекта практически невозможно рассчитывать на лидерство на рынке. Только в MWS Cloud спрос на инфраструктуру для ИИ за год вырос в два раза. При этом недостаточно просто обучить AI-модель. Её ещё нужно интегрировать в бизнес-процессы компании, наладить её бесперебойную работу, отслеживать успешность её работы. Inference Valve позволяет сделать это из коробки с помощью нескольких простых команд. С её помощью LLM и CV-модели в десятки раз быстрее интегрируются с ИТ-системами компании, операционная нагрузка на ML-команды при эксплуатации моделей снижается на 70%, степень автоматизации CI/CD повышается более чем на треть, а затраты на GPU снижаются более чем на 15%», — отметил CEO MWS Cloud, исполнительный директор МТС Web Services Игорь Зарубинский.
--
За новостями телекома и IT удобно следить в телеграм-канале abloud62. Региональные новости и анонсы пресс-релизов вы найдете в канале abloudRealTime, также подключайтесь к каналу Бойко про телеком ВКонтакте
теги: искусственный интеллект цифровые платформы облачные услуги MWS МТС
--
Публикации по теме:
12.03. Yandex B2B Tech объявил об итогах работы за 2025 год
04.03. Ericsson показала работу сети 6G в условиях лаборатории в США
18.02. Компания Adani Enterprises заявила, что инвестирует в ЦОДы, готовые к ИИ, $100 млрд к 2035 году
10.02. Cadence представляет ИИ-агента для проектирования чипов
05.02. Amazon MGM Studios - ИИ выходит на съёмочную площадку
30.01. Обзор рынка ИИ-браузеров от AI Port
25.01. 1 МВт на стойку ИИ ЦОД - идем к новому де-факто стандарту
01.09. MWS Cloud в 1,5 раза увеличила мощности GPU-облака для искусственного интеллекта
14.01. B2B: МТС Web Services запустила сервис для безопасной работы ИИ с персональными данными
06.12. МТС Web Services сообщает о начале работ по расширению мощностей ЦОД GreenBuschDC
28.08. МТС запустила еще 2 кластера на базе GPU для облачного ИИ
09.08. МТС Web Services запустил в Санкт-Петербурге GPU-облако для обучения ИИ
27.06. ВымпелКом и Brand Analytics представили рейтинг компаний и институтов, занимающихся ИИ в России
30.01. МТС поможет решить проблемы опустынивания и засухи в России
26.07. Билайн и Политех Санкт-Петербурга будут сотрудничать в области ИИ и bigdata
27.01. IC Insights выпустил новое исследование мирового рынка микроэлектроники - McClean Report 2021
28.08. МТС подписала соглашение о сотрудничестве с руководством Пермского края
10.10. Huawei улучшила свои позиции в рейтинге ведущих глобальных брендов
18.04. Узбекистан и ZTE укрепляют стратегическое партнерство для ускорения цифровой трансформации
17.04. Прибыль Ericsson упала на 79% - компания предупреждает о росте затрат на чипы
17.04. Yadro запускает приём заявок на оплачиваемую летнюю стажировку «Импульс 2026»
17.04. Tesla ищет инженеров для Terafab на Тайване
17.04. TSMC: CoWoS остается основой для крупнейших ИИ-чипов, и CoPoS все ближе
17.04. МегаФон в Республике Коми - покрытие 4G расширено новой базовой станцией на въезде в Усинск
17.04. МТС в Магаданской области запустил сеть LTE в поселке Эвенск
17.04. OpenAI заключила с Cerebras многомиллиардное соглашение
17.04. В России выпустили первую партию микросхем SPD
17.04. Билайн представил итоги развития в 2025 году в пейзаже «особого пути» российского телекома. Часть 1
16.04. Минцифры представило проект приказа с требованиями к БС O-RAN
16.04. МТС в Новосибирской области - связь улучшена в Ленинском районе
15.04. Билайн увеличил пропускную способность для российских видеосервисов
17.04. OnePlus Nord CE 6 Lite – Dimensity 7400, 7000 мАч, а AMOLED заменили на LCD
17.04. Oppo Reno16 Pro получит камеру 200 МП, перископ, Dimensity 9500s и батарея 7000+ мАч
16.04. Vivo T5 Pro – 9020 мАч, 90 Вт, IP69 и Snapdragon 7s Gen 4 от 29 999 рупий
16.04. Oppo F33 и F33 Pro – ребрендинг с AMOLED, 7000 мАч и IP69K
16.04. Poco C81 Pro получи 6.9" дислеей 120 Гц, АКБ 6000 мАч и Unisoc T7250
15.04. Motorola Razr 70 Ultra получит Snapdragon 8 Elite и батарею на 6% больше
15.04. Tecno Spark 50 4G – Helio G81, 7000 мАч и связь без сети за 1.5 км
15.04. T1 Phone от Trump Mobile – $499 за AMOLED 120 Гц и Snapdragon 7
14.04. Redmi A7 Pro 5G – HyperOS 3, Unisoc T8300 и 6300 мАч за 11 499 рупий
14.04. Oppo Pad Mini с 8.8-дюймовым OLED-экраном 144 Гц и Snapdragon 8 Gen 5 представят 21 апреля
14.04. Rollme G9 – умные часы с офлайн-картами, двухдиапазонным GNSS и весом 32 грамма
13.04. Realme Narzo 100 Lite 5G – 7000 мАч "Titan Battery", 144 Гц и Dimensity 6300 за 13 000 рупий
13.04. CMF Phone 3 Pro получит Snapdragon 7s Gen 4 и металлическую рамку
13.04. Анонс Huawei Pura 90 Pro ожидается 20 апреля
10.04. Realme C100 4G – в000 мАч, IP69K и Helio G92 Max за 292 доллара
10.04. AI+ Nova 2 и Nova 2 Ultra – два подхода к бюджетному сегменту в Индии
10.04. Oppo A6s Pro – OLED, 7000 мАч, 80 Вт и Dimensity 6300
09.04. Moto Pad 2026 – 2.5K-экран, 5G и четыре динамика за 250 долларов
09.04. Motorola Moto G Stylus (2026) – стилус с наклоном, защита IP69 и AMOLED за 500 долларов
08.04. Oppo A6k с АКБ 7000 мАч, экраном 120 Гц и Dimensity 6300 оценен 290 долларов