Вычислительная техника: В Yadro успешно протестировали GigaChat на новых ИИ-серверах собственной разработки

MForum.ru

Вычислительная техника: В Yadro успешно протестировали GigaChat на новых ИИ-серверах собственной разработки

03.02.2026, MForum.ru


Yadro объявила об успешной валидации работы on-prem версии нейросетевой модели GigaChat от Сбера на платформе своего нового ИИ-сервера Yadro G4208P G3. Тестирование подтвердило готовность новых серверов к эксплуатации в корпоративных инфраструктурах с повышенными требованиями к производительности при работе с передовыми моделями искусственного интеллекта. 

 

ИИ сервер Yadro G4208P G3

 

Тесты проводились группой компаний ЦРТ на базе операционных систем Astra Linux и Platform V SberLinux. В составе тестовой конфигурации использовались четыре графические карты, обеспечивавшие необходимый уровень производительности при работе с моделью. Пилотный проект подтвердил готовность серверов к работе с современными ИИ-нагрузками — от анализа больших данных до прикладного использования ML-решений.

В ходе нагрузочных испытаний сервис GigaChat на сервере Yadro G4208P G3 показал устойчивую работу под реальной нагрузкой. Во всех тестовых сценариях не зафиксировано ни одного сбоя или отфильтрованного запроса: суммарно успешно обработано более 7 тысяч запросов для разных конфигураций моделей.

Наиболее сбалансированные результаты показала модель GigaChat Max2 в конфигурации FP16. При увеличении числа параллельных запросов до 25 потоков система продолжает наращивать пропускную способность, достигая до 48,5 запросов в минуту, при этом задержки растут контролируемо и остаются ниже, чем у других протестированных конфигураций.

Важно учитывать характер нагрузки: медианная длина ответа составляет 550–650 токенов, то есть это развернутые тексты, а не короткие реплики. Скорость генерации находится на уровне 19–30 мс на токен, что соответствует 33–50 токенам в секунду на поток. Поэтому суммарная задержка в десятки секунд обусловлена в первую очередь объемом генерируемого текста и очередью при высокой параллельности, а не низкой производительностью оборудования.

Полученные результаты имеют особое значение для корпоративных заказчиков, заинтересованных в развертывании GigaChat в собственных ЦОД. Для них дополнительным преимуществом является то, что серверы Yadro G4208P G3 включены в Единый реестр российской радиоэлектронной продукции Минпромторга. Это подтверждает их соответствие критериям импортозамещения и позволяет использовать оборудование в проектах с особыми требованиями к локализации. Таким образом, приобретение on-prem модели GigaChat органично сочетается с выбором ИИ-сервера Yadro, формируя комплексное отечественное решение для внедрения искусственного интеллекта в корпоративных и государственных инфраструктурах.

Дмитрий Дырмовский, генеральный директор группы компаний ЦРТ: «Ключевой запрос крупного бизнеса и госсектора — внедрение прогрессивных отечественных решений на основе генеративного искусственного интеллекта. Актуальный тренд — внедрение облачных решений, но при повышенных требованиях к безопасности формируется спрос на on-prem-внедрения — установку в закрытый контур организаций. Появление полноценной российской GPU-платформы помогает удовлетворить такой спрос. Результаты тестирования on-prem модели GigaChat c cерверами Yadro позволили нам убедиться в их совместимости и высокой эффективности, а главное — открыть для всех наших клиентов комплексное решение, включающее нейросетевую модель Сбера GigaChat и инфраструктуру YADRO для безопасного внедрения новейших GenAI-решений».

Павел Егоров, директор по продуктам компании Yadro: «Растущий интерес бизнеса к внедрению искусственного интеллекта в ключевые процессы всё чаще приводит участников ИТ-рынка к осознанию необходимости развёртывания генеративных и корпоративных моделей в собственных инфраструктурах. Для этого требуются производительные и надёжные решения, адаптированные для быстрого и безопасного внедрения в существующую ИТ-среду. Успешная интеграция GigaChat с нашими серверами показала, что такие задачи уже могут эффективно решаться на базе отечественного оборудования: архитектура нового ИИ-сервера Yadro обеспечивает высокую производительность и стабильность при длительных нагрузках, а гибкая конфигурация позволяет адаптировать систему под конкретные требования. Развивая такие проекты, в партнёрстве с ведущими игроками рынка мы формируем устойчивую технологическую базу, которая позволяет отечественным решениям уверенно конкурировать и развиваться на уровне мировых стандартов».

Поддержка до 8 GPU, высокоскоростные соединения NVLink Bridge, современные процессоры (CPU) и память DDR5 соответствуют архитектуре ведущих зарубежных ИИ-серверов (например, Dell PowerEdge XE9680). При этом российский сервер - реестровый и готов к работе с разным ПО, включая российские ОС и платформы. В полной конфигурации - это флагманское и дорогое решение для сложных задач.

Если придираться, то стоит отметить, что высокая производительность определяется доступностью импортных GPU. Но... альтернатив импорту в этом плане пока что нет. 

--

За новостями наземного и спутникового телекома удобно следить в телеграм-канале abloud62. Региональные новости телекома, новости искусственного интеллекта и ЦОД вы найдете в канале abloudRealTime, новости микроэлектроники можно найти в моем канале RUSmicro, также подключайтесь к каналу Бойко про телеком ВКонтакте

теги искусственный интеллект вычислительная техника сервера Yadro GigaChat

-- 

© Алексей Бойко, MForum.ru


Публикации по теме:

10.02. Сбербанк может вложить в создание нового суперкомпьютера до 0.5 трлн

09.02. Yadro объявляет о поддержке ИИ ускорителей Nvidia H200 и Nvidia RTX PRO 6000 Blackwell SE в своих серверах

08.02. Ожидается, что квантовые вычисления станут ключевой технологией следующего поколения для решения сложных задач будущего

27.01. Серверы и СХД Yadro прошли тестирование в администрации Южно-Сахалинска

16.12. Китай запустил крупнейший в мире распределенный ИИ-суперкомпьютер

11.12. МИЭТ и Yadro открыли совместную научно-исследовательскую лабораторию

27.11. Европа наращивает мощности в квантовой гонке: IQM инвестирует в расширение производства в Финляндии

31.10. Минэнерго США в партнерстве с AMD планирует построить два суперкомпьютера с инвестициями в $1 млрд

28.10. Yadro объявляет о начале серийных продаж ПК Kvarda Tau mini в форм-факторе Ultra Small

14.05. В АРПЭ оценили российский рынок серверов и говорят, что он сокращается второй год подряд

10.02. Продажи ПК в РФ в 2024 году выросли на 22% до 3 млн штук

22.01. В Испании пытаются обустроить собственную микроэлектронику

21.11. ФЦПРИИ закупит сервера и телеком-оборудование для обучения ИИ на 665 млн рублей

13.11. В МВД недовольны серверами на процессорах Эльбрус и сложностями в их получении

06.03. Аквариус выпустил первые сервера линейки MEC

18.07. «Казахстанским серверам» не повторить успеха «белорусских креветок»

24.11. Конспекты: В.Богданов, "Созвездие "Байкал". Экосистема ПО для процессоров Baikal. Текущее состояние и перспективы"

22.11. Intel опубликовала обновление драйвера Software Defined Silicon

19.11. Яндекс становится еще одним участником быстро растущего рынка российских серверов

15.02. Компания ДЕПО Компьютерс анонсирует новые серверы и СХД ДЕПО на базе отечественных процессоров Эльбрус

Обсуждение (открыть в отдельном окне)

В форуме нет сообщений.

Новое сообщение:
Complete in 1 ms, lookup=0 ms, find=1 ms

Последние сообщения в форумах

Все форумы »



Поиск по сайту:


Колонка редактора

14.04. РТУ МИРЭА совместно с АНО КПП создадут «национальный полигон» для тестирования продукции отечественной химической продукции и материалов, используемых в производстве печатных плат

13.04. В нефтегазохимическом секторе доля закупок ИТ-оборудования выросла почти в 1,5 раза

13.04. Инженеры USC создали чип памяти, работающий при температуре 700 °C

13.04. Rapidus запускает прототипную линию бэк-энда

13.04. SpaceX приступила к установке оборудования на предприятии в Техасе: начало производства намечено на конец 2026 года

13.04. Билайн в Самарской области - покрытие 4G усилено на федеральной трассе М-5

13.04. МТС поделилась динамикой прироста аудитории новых для россиян мессенджеров

13.04. Rapidus получит от правительства Японии дополнительные 4 млрд долларов на исследования и разработку 2-нм чипов

13.04. МегаФон в Челябинской области - покрытие 4G улучшено на озере Кременкуль

13.04. Телеком-фантастика: 2045 год, последние вышки сотовой связи только что отключены, и низкоорбитальные спутники обрабатывают всю связь?

10.04. Использование Starlink растет в некоторых городских районах США

10.04. МТС в Забайкальском крае расширил сеть LTE в трёх округах

10.04. Ростелеком примеривается к стройке дата-центра мощностью 100 МВт

10.04. Amazon рассматривает возможности продажи собственных ИИ-чипов

10.04. Какие геостационарные аппараты запланированы к производству в России

Все статьи >>


Новости

14.04. Redmi A7 Pro 5G – HyperOS 3, Unisoc T8300 и 6300 мАч за 11 499 рупий

14.04. Oppo Pad Mini с 8.8-дюймовым OLED-экраном 144 Гц и Snapdragon 8 Gen 5 представят 21 апреля

14.04. Rollme G9 – умные часы с офлайн-картами, двухдиапазонным GNSS и весом 32 грамма

13.04. Realme Narzo 100 Lite 5G – 7000 мАч "Titan Battery", 144 Гц и Dimensity 6300 за 13 000 рупий

13.04. CMF Phone 3 Pro получит Snapdragon 7s Gen 4 и металлическую рамку

13.04. Анонс Huawei Pura 90 Pro ожидается 20 апреля

10.04. Realme C100 4G – в000 мАч, IP69K и Helio G92 Max за 292 доллара

10.04. AI+ Nova 2 и Nova 2 Ultra – два подхода к бюджетному сегменту в Индии

10.04. Oppo A6s Pro – OLED, 7000 мАч, 80 Вт и Dimensity 6300

09.04. Moto Pad 2026 – 2.5K-экран, 5G и четыре динамика за 250 долларов

09.04. Motorola Moto G Stylus (2026) – стилус с наклоном, защита IP69 и AMOLED за 500 долларов

08.04. Oppo A6k с АКБ 7000 мАч, экраном 120 Гц и Dimensity 6300 оценен 290 долларов

08.04.  Tecno наконец раскрыла график обновления до Android 16 — с опозданием на поколение

08.04. Представлен Realme C100 5G с АКБ 7000 мАч, 144 Гц экраном и Dimensity 6300 за 215 долларов

07.04. Oppo F33 Pro 5G – IP69K, 50 МП фронталка и батарея 7000 мАч за 35 000 рупий

07.04. Redmi A7 Pro 5G с батареей 6300 мАч и Circle to Search выходит в Индии

06.04. Vivo T5 Pro с АКб 9020 мАч – "ультимативная мощь" или маркетинг?

06.04. Oppo A6c выходит на глобальный рынок

03.04. Honor Play 80 Pro – 7000 мАч и IP65, но экран 60 Гц и Android 15

03.04. Первые тизеры раскрывают ультратонкий дизайн Honor 600 Series