Облачные сервисы. Искусственный интеллект: В MWS запустили платформу для работы с LLM и моделями компьютерного зрения

MForum.ru

Облачные сервисы. Искусственный интеллект: В MWS запустили платформу для работы с LLM и моделями компьютерного зрения

12.08.2025, MForum.ru


MWS Cloud (входит в МТС Web Services) запустило платформу Inference Valve, позволяющую внедрять и эксплуатировать модели AI. В частности, можно выводить в продакшн любые обученные ML-модели, большие языковые модели (LLM), модели компьютерного зрения (CV).

Развернув модели можно их подключать к IT-системам компании через стандартные API, масштабировать, обновлять и мониторить. Платформа должна обеспечить сокращение времени внедрения моделей в бизнес-процессы, существенно снизить операционную нагрузку на команды за счет автоматизации рутины - от упаковки модели до ее сопровождения.

С этим запуском MWS Cloud вышла на рынок платформ для инференса AI моделей, размер этого рынка оценивают более, чем в 15 млрд рублей.

С помощью платформы CV-модели могут автоматически анализировать видео, находя определенные объекты, сцены и действия или классифицировать медицинские изображения. ML- и LLM-модели смогут генерировать и структурировать тексты, анализировать данные, создавать их описание, прогнозировать показатели маркетинга и продаж, отвечать на часто задаваемые вопросы в HR-порталах. Также на платформе можно разворачивать голосовые модели для синтеза и анализа речи, а также внедрения их в колл-центры.

Компании могут развернуть как собственные обученные AI-модели, так и воспользоваться готовыми к работе опенсорсными моделями. Кроме того, Inference Valve интегрируется с ML-платформой и инструментами непрерывной разработки (CI/CD), что позволяет выстроить бесшовный процесс от обучения ИИ до его внедрения в бизнес-процессы и непрерывного обновления.

Платформа доступна в частном облаке на инфраструктуре MWS Cloud, on-prem на серверах заказчика, а также в составе программно-аппаратных комплексов (ПАК) в закрытом контуре, включая режимы с ограниченным доступом к внешним сетям.

После запуска кластера специалисты заказчика загружают артефакты модели (например, ONNX, TorchScript) в платформу, после чего она автоматически формирует контейнер сервиса и публикует эндпоинт. Платформа поддерживает одновременную работу сразу с несколькими моделями с выделением квот вычислительных ресурсов, управление версиями, маршрутизацию трафика между версиями и масштабирование под нагрузку как на GPU, так и на CPU.

Inference Valve также предоставляет метрики задержек и пропускной способности, мониторинг доступности, алёрты и дашборды; доступна телеметрия качества, включая отслеживание дрейфа данных и моделей, контроль целевых метрик и уведомления при деградации. Интеграция с системами наблюдаемости (Prometheus/Grafana) и журналированием запросов упрощает аудит и разбор инцидентов.

«Без активного внедрения искусственного интеллекта практически невозможно рассчитывать на лидерство на рынке. Только в MWS Cloud спрос на инфраструктуру для ИИ за год вырос в два раза. При этом недостаточно просто обучить AI-модель. Её ещё нужно интегрировать в бизнес-процессы компании, наладить её бесперебойную работу, отслеживать успешность её работы. Inference Valve позволяет сделать это из коробки с помощью нескольких простых команд. С её помощью LLM и CV-модели в десятки раз быстрее интегрируются с ИТ-системами компании, операционная нагрузка на ML-команды при эксплуатации моделей снижается на 70%, степень автоматизации CI/CD повышается более чем на треть, а затраты на GPU снижаются более чем на 15%», — отметил CEO MWS Cloud, исполнительный директор МТС Web Services Игорь Зарубинский.

--

За новостями телекома и IT удобно следить в телеграм-канале abloud62. Региональные новости и анонсы пресс-релизов вы найдете в канале abloudRealTime, также подключайтесь к каналу Бойко про телеком ВКонтакте

теги: искусственный интеллект цифровые платформы облачные услуги MWS МТС

-- 

© Алексей Бойко, MForum.ru


Публикации по теме:

12.03. Yandex B2B Tech объявил об итогах работы за 2025 год

04.03. Ericsson показала работу сети 6G в условиях лаборатории в США

18.02. Компания Adani Enterprises заявила, что инвестирует в ЦОДы, готовые к ИИ, $100 млрд к 2035 году

10.02. Cadence представляет ИИ-агента для проектирования чипов

05.02. Amazon MGM Studios - ИИ выходит на съёмочную площадку

30.01. Обзор рынка ИИ-браузеров от AI Port

25.01. 1 МВт на стойку ИИ ЦОД - идем к новому де-факто стандарту

01.09. MWS Cloud в 1,5 раза увеличила мощности GPU-облака для искусственного интеллекта

14.01. B2B: МТС Web Services запустила сервис для безопасной работы ИИ с персональными данными

06.12. МТС Web Services сообщает о начале работ по расширению мощностей ЦОД GreenBuschDC

28.08. МТС запустила еще 2 кластера на базе GPU для облачного ИИ

09.08. МТС Web Services запустил в Санкт-Петербурге GPU-облако для обучения ИИ

27.06. Билайн Big Data & AI и Сеченовский институт создали ИИ-модель для оценки прогноза рецидива рака почки

27.06. ВымпелКом и Brand Analytics представили рейтинг компаний и институтов, занимающихся ИИ в России

30.01. МТС поможет решить проблемы опустынивания и засухи в России

26.07. Билайн и Политех Санкт-Петербурга будут сотрудничать в области ИИ и bigdata

27.01. IC Insights выпустил новое исследование мирового рынка микроэлектроники - McClean Report 2021

28.08. МТС подписала соглашение о сотрудничестве с руководством Пермского края

07.04. Oracle Telco Day: Как справиться с «цунами данных» и подготовить ИТ для бизнеса операторов в эпоху 5G

10.10. Huawei улучшила свои позиции в рейтинге ведущих глобальных брендов

Обсуждение (открыть в отдельном окне)

В форуме нет сообщений.

Новое сообщение:
Complete in 2 ms, lookup=0 ms, find=2 ms

Последние сообщения в форумах

Все форумы »



Поиск по сайту:


Колонка редактора

18.04. Узбекистан и ZTE укрепляют стратегическое партнерство для ускорения цифровой трансформации

17.04. Прибыль Ericsson упала на 79% - компания предупреждает о росте затрат на чипы

17.04. Yadro запускает приём заявок на оплачиваемую летнюю стажировку «Импульс 2026»

17.04. Tesla ищет инженеров для Terafab на Тайване

17.04. TSMC: CoWoS остается основой для крупнейших ИИ-чипов, и CoPoS все ближе

17.04. МегаФон в Республике Коми - покрытие 4G расширено новой базовой станцией на въезде в Усинск

17.04. МТС в Магаданской области запустил сеть LTE в поселке Эвенск

17.04. OpenAI заключила с Cerebras многомиллиардное соглашение

17.04. В России выпустили первую партию микросхем SPD

17.04. Билайн представил итоги развития в 2025 году в пейзаже «особого пути» российского телекома. Часть 1

16.04. Минцифры представило проект приказа с требованиями к БС O-RAN

16.04. МегаФон в Сахалинской области - связь улучшена рефармингом в Холмске, Корсакове, Горнозаводске и Соловьевке

16.04. МТС в Новосибирской области - связь улучшена в Ленинском районе

15.04. Билайн увеличил пропускную способность для российских видеосервисов

15.04. Rubetek расширяет производственные мощности в Орле

Все статьи >>


Новости

17.04. OnePlus Nord CE 6 Lite – Dimensity 7400, 7000 мАч, а AMOLED заменили на LCD

17.04. Oppo Reno16 Pro получит камеру 200 МП, перископ, Dimensity 9500s и батарея 7000+ мАч

16.04. Vivo T5 Pro – 9020 мАч, 90 Вт, IP69 и Snapdragon 7s Gen 4 от 29 999 рупий

16.04. Oppo F33 и F33 Pro – ребрендинг с AMOLED, 7000 мАч и IP69K

16.04. Poco C81 Pro получи 6.9" дислеей 120 Гц, АКБ 6000 мАч и Unisoc T7250

15.04. Motorola Razr 70 Ultra получит Snapdragon 8 Elite и батарею на 6% больше

15.04. Tecno Spark 50 4G – Helio G81, 7000 мАч и связь без сети за 1.5 км

15.04. T1 Phone от Trump Mobile – $499 за AMOLED 120 Гц и Snapdragon 7

14.04. Redmi A7 Pro 5G – HyperOS 3, Unisoc T8300 и 6300 мАч за 11 499 рупий

14.04. Oppo Pad Mini с 8.8-дюймовым OLED-экраном 144 Гц и Snapdragon 8 Gen 5 представят 21 апреля

14.04. Rollme G9 – умные часы с офлайн-картами, двухдиапазонным GNSS и весом 32 грамма

13.04. Realme Narzo 100 Lite 5G – 7000 мАч "Titan Battery", 144 Гц и Dimensity 6300 за 13 000 рупий

13.04. CMF Phone 3 Pro получит Snapdragon 7s Gen 4 и металлическую рамку

13.04. Анонс Huawei Pura 90 Pro ожидается 20 апреля

10.04. Realme C100 4G – в000 мАч, IP69K и Helio G92 Max за 292 доллара

10.04. AI+ Nova 2 и Nova 2 Ultra – два подхода к бюджетному сегменту в Индии

10.04. Oppo A6s Pro – OLED, 7000 мАч, 80 Вт и Dimensity 6300

09.04. Moto Pad 2026 – 2.5K-экран, 5G и четыре динамика за 250 долларов

09.04. Motorola Moto G Stylus (2026) – стилус с наклоном, защита IP69 и AMOLED за 500 долларов

08.04. Oppo A6k с АКБ 7000 мАч, экраном 120 Гц и Dimensity 6300 оценен 290 долларов