Облачные сервисы. Искусственный интеллект: В MWS запустили платформу для работы с LLM и моделями компьютерного зрения

MForum.ru

Облачные сервисы. Искусственный интеллект: В MWS запустили платформу для работы с LLM и моделями компьютерного зрения

12.08.2025, MForum.ru


MWS Cloud (входит в МТС Web Services) запустило платформу Inference Valve, позволяющую внедрять и эксплуатировать модели AI. В частности, можно выводить в продакшн любые обученные ML-модели, большие языковые модели (LLM), модели компьютерного зрения (CV).

Развернув модели можно их подключать к IT-системам компании через стандартные API, масштабировать, обновлять и мониторить. Платформа должна обеспечить сокращение времени внедрения моделей в бизнес-процессы, существенно снизить операционную нагрузку на команды за счет автоматизации рутины - от упаковки модели до ее сопровождения.

С этим запуском MWS Cloud вышла на рынок платформ для инференса AI моделей, размер этого рынка оценивают более, чем в 15 млрд рублей.

С помощью платформы CV-модели могут автоматически анализировать видео, находя определенные объекты, сцены и действия или классифицировать медицинские изображения. ML- и LLM-модели смогут генерировать и структурировать тексты, анализировать данные, создавать их описание, прогнозировать показатели маркетинга и продаж, отвечать на часто задаваемые вопросы в HR-порталах. Также на платформе можно разворачивать голосовые модели для синтеза и анализа речи, а также внедрения их в колл-центры.

Компании могут развернуть как собственные обученные AI-модели, так и воспользоваться готовыми к работе опенсорсными моделями. Кроме того, Inference Valve интегрируется с ML-платформой и инструментами непрерывной разработки (CI/CD), что позволяет выстроить бесшовный процесс от обучения ИИ до его внедрения в бизнес-процессы и непрерывного обновления.

Платформа доступна в частном облаке на инфраструктуре MWS Cloud, on-prem на серверах заказчика, а также в составе программно-аппаратных комплексов (ПАК) в закрытом контуре, включая режимы с ограниченным доступом к внешним сетям.

После запуска кластера специалисты заказчика загружают артефакты модели (например, ONNX, TorchScript) в платформу, после чего она автоматически формирует контейнер сервиса и публикует эндпоинт. Платформа поддерживает одновременную работу сразу с несколькими моделями с выделением квот вычислительных ресурсов, управление версиями, маршрутизацию трафика между версиями и масштабирование под нагрузку как на GPU, так и на CPU.

Inference Valve также предоставляет метрики задержек и пропускной способности, мониторинг доступности, алёрты и дашборды; доступна телеметрия качества, включая отслеживание дрейфа данных и моделей, контроль целевых метрик и уведомления при деградации. Интеграция с системами наблюдаемости (Prometheus/Grafana) и журналированием запросов упрощает аудит и разбор инцидентов.

«Без активного внедрения искусственного интеллекта практически невозможно рассчитывать на лидерство на рынке. Только в MWS Cloud спрос на инфраструктуру для ИИ за год вырос в два раза. При этом недостаточно просто обучить AI-модель. Её ещё нужно интегрировать в бизнес-процессы компании, наладить её бесперебойную работу, отслеживать успешность её работы. Inference Valve позволяет сделать это из коробки с помощью нескольких простых команд. С её помощью LLM и CV-модели в десятки раз быстрее интегрируются с ИТ-системами компании, операционная нагрузка на ML-команды при эксплуатации моделей снижается на 70%, степень автоматизации CI/CD повышается более чем на треть, а затраты на GPU снижаются более чем на 15%», — отметил CEO MWS Cloud, исполнительный директор МТС Web Services Игорь Зарубинский.

--

За новостями телекома и IT удобно следить в телеграм-канале abloud62. Региональные новости и анонсы пресс-релизов вы найдете в канале abloudRealTime, также подключайтесь к каналу Бойко про телеком ВКонтакте

теги: искусственный интеллект цифровые платформы облачные услуги MWS МТС

-- 

© Алексей Бойко, MForum.ru


Публикации по теме:

12.03. Yandex B2B Tech объявил об итогах работы за 2025 год

04.03. Ericsson показала работу сети 6G в условиях лаборатории в США

18.02. Компания Adani Enterprises заявила, что инвестирует в ЦОДы, готовые к ИИ, $100 млрд к 2035 году

10.02. Cadence представляет ИИ-агента для проектирования чипов

05.02. Amazon MGM Studios - ИИ выходит на съёмочную площадку

30.01. Обзор рынка ИИ-браузеров от AI Port

25.01. 1 МВт на стойку ИИ ЦОД - идем к новому де-факто стандарту

01.09. MWS Cloud в 1,5 раза увеличила мощности GPU-облака для искусственного интеллекта

14.01. B2B: МТС Web Services запустила сервис для безопасной работы ИИ с персональными данными

06.12. МТС Web Services сообщает о начале работ по расширению мощностей ЦОД GreenBuschDC

28.08. МТС запустила еще 2 кластера на базе GPU для облачного ИИ

09.08. МТС Web Services запустил в Санкт-Петербурге GPU-облако для обучения ИИ

27.06. Билайн Big Data & AI и Сеченовский институт создали ИИ-модель для оценки прогноза рецидива рака почки

27.06. ВымпелКом и Brand Analytics представили рейтинг компаний и институтов, занимающихся ИИ в России

30.01. МТС поможет решить проблемы опустынивания и засухи в России

26.07. Билайн и Политех Санкт-Петербурга будут сотрудничать в области ИИ и bigdata

27.01. IC Insights выпустил новое исследование мирового рынка микроэлектроники - McClean Report 2021

28.08. МТС подписала соглашение о сотрудничестве с руководством Пермского края

07.04. Oracle Telco Day: Как справиться с «цунами данных» и подготовить ИТ для бизнеса операторов в эпоху 5G

10.10. Huawei улучшила свои позиции в рейтинге ведущих глобальных брендов

Обсуждение (открыть в отдельном окне)

В форуме нет сообщений.

Новое сообщение:
Complete in 1 ms, lookup=0 ms, find=1 ms

Последние сообщения в форумах

Все форумы »



Поиск по сайту:


Колонка редактора

08.05. Китай одобрил выделение спектра в диапазоне 6 ГГц для испытаний 6G

08.05. Кремниевые осцилляторы вместо кубитов - корейский путь к сверхбыстрым вычислениям

08.05. Канадский центр фотонного производства "приватизируют"

08.05. Intel передала студентам Вьетнама оборудование для сборки и тестирования микросхем

08.05. Huawei расширяет «офлайн-звонки»

08.05. Билайн в Тюменской области - покрытие 4G и домашний интернет расширены в восьми жилых комплексах

08.05. МегаФон в Оренбургской области - мобильный интернет ускорен в Бугуруслане

07.05. SpaceX представила планы строительства Terafab в Техасе с оценкой стоимости в $55 млрд

07.05. OpenAI завершила формирование совместного предприятия DeployCo с группой фондов прямых инвестиций

07.05. МТС запустил переводы для физлиц на кошельки WeChat Pay без комиссии

07.05. Билайн в Удмуртской республике - покрытие 4G обеспечено indoor-оборудованием в 4 ТЦ Ижевска

07.05. Росэл сообщает о начале серийного производства новой модификации отечественных светочувствительных КМОП-матриц с разрешением 4К

07.05. "Минцифры сообщает об отсутствии планов по отключению и ограничению мобильного интернета в Москве 7-8 мая"

07.05. МТС в Якутии - сеть LTE усилена в районе строительства Ленского моста

06.05. Индия дозрела до собственной низкоорбитальной группировки

Все статьи >>


Новости

08.05. OnePlus Nord CE6 Lite с 7000 мАч, 144 Гц LCD и Dimensity 7400 Apex представлен официально

08.05. OnePlus Nord CE6 с АКБ 8000 мАч, AMOLED-экраном 144 Гц и Snapdragon 7s Gen 4 представлен официально

07.05. Honor Play 11 Plus – 7000 мАч, 120 Гц AMOLED и Dimensity 6500 Elite за $320

07.05. Honor Play 70C – Helio G81 Ultra, 5300 мАч и Android 15 за $90

06.05. Honor Play 80 Plus – 7500 мАч, Snapdragon 4 Gen 4 и AI-кнопка за $249

06.05. Samsung Galaxy S27 Ultra получит переменную диафрагму в основной камере?

06.05. Samsung Galaxy A27 – круглый вырез камеры, Snapdragon 6 Gen 3 и 12 МП фронталка

05.05. Xiaomi Smart Band 10 Pro – 1.74" AMOLED, алюминиевый корпус и 21 день работы

05.05. iQOO 15T – 200 МП камера, 8000 мАч, 100 Вт и Dimensity 9500

05.05. Lenovo Legion Y70 (2026) – 2K-экран, 8000 мАч и SD 8 Gen 5

04.05. 7 мая представят Huawei Nova 15 Max – 8500 мАч, 50 МП RYYB и AMOLED

04.05. Moto G47 – 108 МП камера, FHD+ 120 Гц, Dimensity 6300 и защита MIL-STD-810H

04.05. iPhone Pro (2027) –изогнутый с 4-х сторон экран и подэкранная камера?

30.04. Tecno Spark 50 Pro 5G – Helio G100 Ultimate, 60 Вт и дизайн от Pova Curve 2

30.04. Официальные рендеры Moto G87 раскрывают 200 МП камеру, OLED-экран и дизайн как у G86

29.04. Poco C81 Pro – 6.9" 120 Гц, 6000 мАч и Unisoc T7250 за $99

29.04. Vivo TWS 5i – 50 часов работы, DeepX 3.0 и Bluetooth 5.4 за 17 долларов

29.04. Vivo Y600 Pro получил АКБ 10 200 мАч с зарядкой 90 Вт и IP69 при толщине 8.25 мм

29.04. Vivo Y600 Pro получил АКБ 10 200 мАч с зарядкой 90 Вт и IP69 при толщине 8.25 мм

28.04. Huawei Mate XT 2 – тройной складной смартфон с Kirin 9050 Pro и батареей 6000+ мАч