Вычислительная техника: В Yadro успешно протестировали GigaChat на новых ИИ-серверах собственной разработки

MForum.ru

Вычислительная техника: В Yadro успешно протестировали GigaChat на новых ИИ-серверах собственной разработки

03.02.2026, MForum.ru


Yadro объявила об успешной валидации работы on-prem версии нейросетевой модели GigaChat от Сбера на платформе своего нового ИИ-сервера Yadro G4208P G3. Тестирование подтвердило готовность новых серверов к эксплуатации в корпоративных инфраструктурах с повышенными требованиями к производительности при работе с передовыми моделями искусственного интеллекта. 

 

ИИ сервер Yadro G4208P G3

 

Тесты проводились группой компаний ЦРТ на базе операционных систем Astra Linux и Platform V SberLinux. В составе тестовой конфигурации использовались четыре графические карты, обеспечивавшие необходимый уровень производительности при работе с моделью. Пилотный проект подтвердил готовность серверов к работе с современными ИИ-нагрузками — от анализа больших данных до прикладного использования ML-решений.

В ходе нагрузочных испытаний сервис GigaChat на сервере Yadro G4208P G3 показал устойчивую работу под реальной нагрузкой. Во всех тестовых сценариях не зафиксировано ни одного сбоя или отфильтрованного запроса: суммарно успешно обработано более 7 тысяч запросов для разных конфигураций моделей.

Наиболее сбалансированные результаты показала модель GigaChat Max2 в конфигурации FP16. При увеличении числа параллельных запросов до 25 потоков система продолжает наращивать пропускную способность, достигая до 48,5 запросов в минуту, при этом задержки растут контролируемо и остаются ниже, чем у других протестированных конфигураций.

Важно учитывать характер нагрузки: медианная длина ответа составляет 550–650 токенов, то есть это развернутые тексты, а не короткие реплики. Скорость генерации находится на уровне 19–30 мс на токен, что соответствует 33–50 токенам в секунду на поток. Поэтому суммарная задержка в десятки секунд обусловлена в первую очередь объемом генерируемого текста и очередью при высокой параллельности, а не низкой производительностью оборудования.

Полученные результаты имеют особое значение для корпоративных заказчиков, заинтересованных в развертывании GigaChat в собственных ЦОД. Для них дополнительным преимуществом является то, что серверы Yadro G4208P G3 включены в Единый реестр российской радиоэлектронной продукции Минпромторга. Это подтверждает их соответствие критериям импортозамещения и позволяет использовать оборудование в проектах с особыми требованиями к локализации. Таким образом, приобретение on-prem модели GigaChat органично сочетается с выбором ИИ-сервера Yadro, формируя комплексное отечественное решение для внедрения искусственного интеллекта в корпоративных и государственных инфраструктурах.

Дмитрий Дырмовский, генеральный директор группы компаний ЦРТ: «Ключевой запрос крупного бизнеса и госсектора — внедрение прогрессивных отечественных решений на основе генеративного искусственного интеллекта. Актуальный тренд — внедрение облачных решений, но при повышенных требованиях к безопасности формируется спрос на on-prem-внедрения — установку в закрытый контур организаций. Появление полноценной российской GPU-платформы помогает удовлетворить такой спрос. Результаты тестирования on-prem модели GigaChat c cерверами Yadro позволили нам убедиться в их совместимости и высокой эффективности, а главное — открыть для всех наших клиентов комплексное решение, включающее нейросетевую модель Сбера GigaChat и инфраструктуру YADRO для безопасного внедрения новейших GenAI-решений».

Павел Егоров, директор по продуктам компании Yadro: «Растущий интерес бизнеса к внедрению искусственного интеллекта в ключевые процессы всё чаще приводит участников ИТ-рынка к осознанию необходимости развёртывания генеративных и корпоративных моделей в собственных инфраструктурах. Для этого требуются производительные и надёжные решения, адаптированные для быстрого и безопасного внедрения в существующую ИТ-среду. Успешная интеграция GigaChat с нашими серверами показала, что такие задачи уже могут эффективно решаться на базе отечественного оборудования: архитектура нового ИИ-сервера Yadro обеспечивает высокую производительность и стабильность при длительных нагрузках, а гибкая конфигурация позволяет адаптировать систему под конкретные требования. Развивая такие проекты, в партнёрстве с ведущими игроками рынка мы формируем устойчивую технологическую базу, которая позволяет отечественным решениям уверенно конкурировать и развиваться на уровне мировых стандартов».

Поддержка до 8 GPU, высокоскоростные соединения NVLink Bridge, современные процессоры (CPU) и память DDR5 соответствуют архитектуре ведущих зарубежных ИИ-серверов (например, Dell PowerEdge XE9680). При этом российский сервер - реестровый и готов к работе с разным ПО, включая российские ОС и платформы. В полной конфигурации - это флагманское и дорогое решение для сложных задач.

Если придираться, то стоит отметить, что высокая производительность определяется доступностью импортных GPU. Но... альтернатив импорту в этом плане пока что нет. 

--

За новостями наземного и спутникового телекома удобно следить в телеграм-канале abloud62. Региональные новости телекома, новости искусственного интеллекта и ЦОД вы найдете в канале abloudRealTime, новости микроэлектроники можно найти в моем канале RUSmicro, также подключайтесь к каналу Бойко про телеком ВКонтакте

теги искусственный интеллект вычислительная техника сервера Yadro GigaChat

-- 

© Алексей Бойко, MForum.ru


Публикации по теме:

10.02. Сбербанк может вложить в создание нового суперкомпьютера до 0.5 трлн

09.02. Yadro объявляет о поддержке ИИ ускорителей Nvidia H200 и Nvidia RTX PRO 6000 Blackwell SE в своих серверах

08.02. Ожидается, что квантовые вычисления станут ключевой технологией следующего поколения для решения сложных задач будущего

27.01. Серверы и СХД Yadro прошли тестирование в администрации Южно-Сахалинска

16.12. Китай запустил крупнейший в мире распределенный ИИ-суперкомпьютер

11.12. МИЭТ и Yadro открыли совместную научно-исследовательскую лабораторию

27.11. Европа наращивает мощности в квантовой гонке: IQM инвестирует в расширение производства в Финляндии

31.10. Минэнерго США в партнерстве с AMD планирует построить два суперкомпьютера с инвестициями в $1 млрд

28.10. Yadro объявляет о начале серийных продаж ПК Kvarda Tau mini в форм-факторе Ultra Small

14.05. В АРПЭ оценили российский рынок серверов и говорят, что он сокращается второй год подряд

10.02. Продажи ПК в РФ в 2024 году выросли на 22% до 3 млн штук

22.01. В Испании пытаются обустроить собственную микроэлектронику

21.11. ФЦПРИИ закупит сервера и телеком-оборудование для обучения ИИ на 665 млн рублей

13.11. В МВД недовольны серверами на процессорах Эльбрус и сложностями в их получении

06.03. Аквариус выпустил первые сервера линейки MEC

18.07. «Казахстанским серверам» не повторить успеха «белорусских креветок»

24.11. Конспекты: В.Богданов, "Созвездие "Байкал". Экосистема ПО для процессоров Baikal. Текущее состояние и перспективы"

22.11. Intel опубликовала обновление драйвера Software Defined Silicon

19.11. Яндекс становится еще одним участником быстро растущего рынка российских серверов

15.02. Компания ДЕПО Компьютерс анонсирует новые серверы и СХД ДЕПО на базе отечественных процессоров Эльбрус

Обсуждение (открыть в отдельном окне)

В форуме нет сообщений.

Новое сообщение:
Complete in 2 ms, lookup=0 ms, find=2 ms

Последние сообщения в форумах

Все форумы »



Поиск по сайту:


Колонка редактора

04.05. Информагентство «Россия сегодня» развернуло локальную ИИ инфраструктуру на базе серверов Yadro

04.05. Huawei ожидает, что выручка от ИИ-чипов в 2026 году вырастет, минимум, на 60%

04.05. МТС в Воронежской области - сеть LTE расширена отечественными базовыми станциями

04.05. МегаФон в Республике Бурятия - покрытие 4G расширено новыми базовыми станциями в сёлах Мостовка и Зырянск

03.05. Созвездие Amazon Leo стало расти быстрее – взят барьер в 300 КА на орбите

01.05. В интересах безопасности…

30.04. Рынок платного ТВ в 2025 году показал рост на фоне блокировок мобильного интернета

30.04. Китайская Lightelligence провела IPO и оценена в 77.9 млрд гонконгских долларов

30.04. Прямая запись углеродных проводников на стеклянных подложках ускорит внедрение совместной упаковки оптики

30.04. Британская EE подключила к сети 5G+ более 50 млн человек

30.04. "Билайн бизнес" представил проект решения для управления горными работами pLTE/5G

30.04. МТС в Омской области - покрытие LTE улучшено рефармингом на юге региона

29.04. Разработку САПР под техпроцессы до 90 нм профинансирует Минпромторг

29.04. В Москве на майские праздники планируют отключения интернета

29.04. Китайский производитель электромобилей Nio делает ставку на собственные чипы

Все статьи >>


Новости

04.05. 7 мая представят Huawei Nova 15 Max – 8500 мАч, 50 МП RYYB и AMOLED

04.05. Moto G47 – 108 МП камера, FHD+ 120 Гц, Dimensity 6300 и защита MIL-STD-810H

04.05. iPhone Pro (2027) –изогнутый с 4-х сторон экран и подэкранная камера?

30.04. Tecno Spark 50 Pro 5G – Helio G100 Ultimate, 60 Вт и дизайн от Pova Curve 2

30.04. Официальные рендеры Moto G87 раскрывают 200 МП камеру, OLED-экран и дизайн как у G86

29.04. Poco C81 Pro – 6.9" 120 Гц, 6000 мАч и Unisoc T7250 за $99

29.04. Vivo TWS 5i – 50 часов работы, DeepX 3.0 и Bluetooth 5.4 за 17 долларов

29.04. Vivo Y600 Pro получил АКБ 10 200 мАч с зарядкой 90 Вт и IP69 при толщине 8.25 мм

29.04. Vivo Y600 Pro получил АКБ 10 200 мАч с зарядкой 90 Вт и IP69 при толщине 8.25 мм

28.04. Huawei Mate XT 2 – тройной складной смартфон с Kirin 9050 Pro и батареей 6000+ мАч

28.04. Geekbench раскрыл детали о Xiaomi 17T – Dimensity 8500, 12 ГБ RAM и Android 16

28.04. Vivo Y500s – 7200 мАч, IP68/IP69 и 50 МП камера за 265 долларов

27.04. Poco C81 и C81x – два бюджетных 4G-смартфона с 120 Гц, большими батареями и ценой от 105 долларов

27.04. Infinix GT 50 Pro – игровые триггеры, Dimensity 8400 Ultimate и жидкостное охлаждение за 406 долларов

27.04. Vivo Y6 5G – 7200 мАч, 120 Гц, "дышащий свет" и защита IP69 за 225 евро

24.04. Honor 600 и 600 Pro – 200 МП камера, IP69K и дизайн в стиле iPhone 17 Pro

24.04. Poco M8s 5G – 7000 мАч, 144 Гц и Snapdragon 6s Gen 3 за $189

24.04. iPhone 18 получит дисплей M12+, как у iPhone 14 Pro, а Pro-версии — новый M16

23.04. OnePlus Watch 4 – титановый корпус, Wear OS 6 и 16 дней работы

23.04. Motorola Edge 70 Pro – 6500 мАч, 90 Вт, три 50 МП камеры и защита IP69