Вычислительная техника: В Yadro успешно протестировали GigaChat на новых ИИ-серверах собственной разработки

MForum.ru

Вычислительная техника: В Yadro успешно протестировали GigaChat на новых ИИ-серверах собственной разработки

03.02.2026, MForum.ru


Yadro объявила об успешной валидации работы on-prem версии нейросетевой модели GigaChat от Сбера на платформе своего нового ИИ-сервера Yadro G4208P G3. Тестирование подтвердило готовность новых серверов к эксплуатации в корпоративных инфраструктурах с повышенными требованиями к производительности при работе с передовыми моделями искусственного интеллекта. 

 

ИИ сервер Yadro G4208P G3

 

Тесты проводились группой компаний ЦРТ на базе операционных систем Astra Linux и Platform V SberLinux. В составе тестовой конфигурации использовались четыре графические карты, обеспечивавшие необходимый уровень производительности при работе с моделью. Пилотный проект подтвердил готовность серверов к работе с современными ИИ-нагрузками — от анализа больших данных до прикладного использования ML-решений.

В ходе нагрузочных испытаний сервис GigaChat на сервере Yadro G4208P G3 показал устойчивую работу под реальной нагрузкой. Во всех тестовых сценариях не зафиксировано ни одного сбоя или отфильтрованного запроса: суммарно успешно обработано более 7 тысяч запросов для разных конфигураций моделей.

Наиболее сбалансированные результаты показала модель GigaChat Max2 в конфигурации FP16. При увеличении числа параллельных запросов до 25 потоков система продолжает наращивать пропускную способность, достигая до 48,5 запросов в минуту, при этом задержки растут контролируемо и остаются ниже, чем у других протестированных конфигураций.

Важно учитывать характер нагрузки: медианная длина ответа составляет 550–650 токенов, то есть это развернутые тексты, а не короткие реплики. Скорость генерации находится на уровне 19–30 мс на токен, что соответствует 33–50 токенам в секунду на поток. Поэтому суммарная задержка в десятки секунд обусловлена в первую очередь объемом генерируемого текста и очередью при высокой параллельности, а не низкой производительностью оборудования.

Полученные результаты имеют особое значение для корпоративных заказчиков, заинтересованных в развертывании GigaChat в собственных ЦОД. Для них дополнительным преимуществом является то, что серверы Yadro G4208P G3 включены в Единый реестр российской радиоэлектронной продукции Минпромторга. Это подтверждает их соответствие критериям импортозамещения и позволяет использовать оборудование в проектах с особыми требованиями к локализации. Таким образом, приобретение on-prem модели GigaChat органично сочетается с выбором ИИ-сервера Yadro, формируя комплексное отечественное решение для внедрения искусственного интеллекта в корпоративных и государственных инфраструктурах.

Дмитрий Дырмовский, генеральный директор группы компаний ЦРТ: «Ключевой запрос крупного бизнеса и госсектора — внедрение прогрессивных отечественных решений на основе генеративного искусственного интеллекта. Актуальный тренд — внедрение облачных решений, но при повышенных требованиях к безопасности формируется спрос на on-prem-внедрения — установку в закрытый контур организаций. Появление полноценной российской GPU-платформы помогает удовлетворить такой спрос. Результаты тестирования on-prem модели GigaChat c cерверами Yadro позволили нам убедиться в их совместимости и высокой эффективности, а главное — открыть для всех наших клиентов комплексное решение, включающее нейросетевую модель Сбера GigaChat и инфраструктуру YADRO для безопасного внедрения новейших GenAI-решений».

Павел Егоров, директор по продуктам компании Yadro: «Растущий интерес бизнеса к внедрению искусственного интеллекта в ключевые процессы всё чаще приводит участников ИТ-рынка к осознанию необходимости развёртывания генеративных и корпоративных моделей в собственных инфраструктурах. Для этого требуются производительные и надёжные решения, адаптированные для быстрого и безопасного внедрения в существующую ИТ-среду. Успешная интеграция GigaChat с нашими серверами показала, что такие задачи уже могут эффективно решаться на базе отечественного оборудования: архитектура нового ИИ-сервера Yadro обеспечивает высокую производительность и стабильность при длительных нагрузках, а гибкая конфигурация позволяет адаптировать систему под конкретные требования. Развивая такие проекты, в партнёрстве с ведущими игроками рынка мы формируем устойчивую технологическую базу, которая позволяет отечественным решениям уверенно конкурировать и развиваться на уровне мировых стандартов».

Поддержка до 8 GPU, высокоскоростные соединения NVLink Bridge, современные процессоры (CPU) и память DDR5 соответствуют архитектуре ведущих зарубежных ИИ-серверов (например, Dell PowerEdge XE9680). При этом российский сервер - реестровый и готов к работе с разным ПО, включая российские ОС и платформы. В полной конфигурации - это флагманское и дорогое решение для сложных задач.

Если придираться, то стоит отметить, что высокая производительность определяется доступностью импортных GPU. Но... альтернатив импорту в этом плане пока что нет. 

--

За новостями наземного и спутникового телекома удобно следить в телеграм-канале abloud62. Региональные новости телекома, новости искусственного интеллекта и ЦОД вы найдете в канале abloudRealTime, новости микроэлектроники можно найти в моем канале RUSmicro, также подключайтесь к каналу Бойко про телеком ВКонтакте

теги искусственный интеллект вычислительная техника сервера Yadro GigaChat

-- 

© Алексей Бойко, MForum.ru


Публикации по теме:

10.02. Сбербанк может вложить в создание нового суперкомпьютера до 0.5 трлн

09.02. Yadro объявляет о поддержке ИИ ускорителей Nvidia H200 и Nvidia RTX PRO 6000 Blackwell SE в своих серверах

08.02. Ожидается, что квантовые вычисления станут ключевой технологией следующего поколения для решения сложных задач будущего

27.01. Серверы и СХД Yadro прошли тестирование в администрации Южно-Сахалинска

16.12. Китай запустил крупнейший в мире распределенный ИИ-суперкомпьютер

11.12. МИЭТ и Yadro открыли совместную научно-исследовательскую лабораторию

27.11. Европа наращивает мощности в квантовой гонке: IQM инвестирует в расширение производства в Финляндии

31.10. Минэнерго США в партнерстве с AMD планирует построить два суперкомпьютера с инвестициями в $1 млрд

28.10. Yadro объявляет о начале серийных продаж ПК Kvarda Tau mini в форм-факторе Ultra Small

14.05. В АРПЭ оценили российский рынок серверов и говорят, что он сокращается второй год подряд

10.02. Продажи ПК в РФ в 2024 году выросли на 22% до 3 млн штук

22.01. В Испании пытаются обустроить собственную микроэлектронику

21.11. ФЦПРИИ закупит сервера и телеком-оборудование для обучения ИИ на 665 млн рублей

13.11. В МВД недовольны серверами на процессорах Эльбрус и сложностями в их получении

06.03. Аквариус выпустил первые сервера линейки MEC

18.07. «Казахстанским серверам» не повторить успеха «белорусских креветок»

24.11. Конспекты: В.Богданов, "Созвездие "Байкал". Экосистема ПО для процессоров Baikal. Текущее состояние и перспективы"

22.11. Intel опубликовала обновление драйвера Software Defined Silicon

19.11. Яндекс становится еще одним участником быстро растущего рынка российских серверов

15.02. Компания ДЕПО Компьютерс анонсирует новые серверы и СХД ДЕПО на базе отечественных процессоров Эльбрус

Обсуждение (открыть в отдельном окне)

В форуме нет сообщений.

Новое сообщение:
Complete in 1 ms, lookup=0 ms, find=1 ms

Последние сообщения в форумах

Все форумы »



Поиск по сайту:


Колонка редактора

24.05. ИКС Холдинг прирос компанией Crosstech Solutions Group

24.05. Миландр обеспечил импортзамещение ряда изделий, необходимых для отечественных БС 5G

22.05. МТС отчиталась за 1q2026 - ростом выручки и OIBDA

22.05. T2 начинает подключать БС в Москве с помощью ВОЛС

22.05. Процессоры Иртыш – это «переклеенный» Loongson или собственная разработка?

22.05. Российский ИИ GigaChat планируют перевести на китайские чипы?

21.05. Плату за международный трафик введут позднее

21.05. SpaceX готова к проведению масштабного IPO

21.05. Облачное доверие на ЦИПР-2026: гибридный баланс, государственный пример и контроль от железа до ПО

21.05. Новосибирская компания Элрон представила одноплатник на процессоре Гиперком-У

21.05. Российский ИИ GigaChat планируют перевести на китайские чипы?

21.05. Забастовка на Samsung отменена: компромисс предотвратил дополнительный импульс дефициту чипов и росту цен

21.05. II Всероссийская конференция по печатным платам: время масштабировать прорывы

21.05. Бюро 1440 и Белинтерсат договорились о сотрудничестве

21.05. Yadro и T1 подписали соглашение о сотрудничестве в области инфраструктурных решений

Все статьи >>


Новости

22.05. Poco Pad C1 – доступный планшет с экраном 2K 120 Гц и батареей 7600 мАч

22.05. Утечка раскрыла параметры HMD Thunder Pro – 50 МП с OIS, OLED 90 Гц и 6000 мАч

22.05. HMD Vibe 2 5G – 6000 мАч, 120 Гц и Android 16 от $115

21.05. iQOO 15T – Dimensity 9500 Monster, 8000 мАч, 200 МП и 144 Гц от $558

21.05. Itel A100 Pro дизайн в стиле iPhone 17 Pro за $95 и с Android Go

21.05. Infinix Hot 70 – получит термохромный дизайн и RGB-подсветка

20.05. Moto G37 и G37 Power – Dimensity 6400, 7000 мАч и Android 16 от 145 долларов

20.05. Motorola Edge (2026) получит плоский дизайн вместо изогнутого

20.05. Дизайн Samsung Galaxy A27 показался на рендерах производителей чехлов

19.05. RedMagic 11S Pro и Pro+ получили разогнанный чип, 8000 мАч, вентилятор и IPX8

19.05. Realme 16T с 8000 мАч, IP69 представят 22 мая

19.05. OnePlus Ace 7 – экран 240 Гц, батарея 9000 мАч и охлаждение с вентилятором?

18.05. Vivo Pocket может получить 200 Мп сенсор Sony LYT-901

18.05. 22 мая представят Realme Watch S5 и Buds Air8 Pro с AMOLED 1500 нит, 55dB ANC, LHDC

16.05. Xiaomi 17 Max – 8000 мАч, 200 МП Leica, 6.9" Super Pixel — анонсируют 21 мая

15.05. Представлен Moto Tag 2 с 600 днями работы, UWB и Google Find Hub

15.05. Xiaomi тизерит Band 10 Pro и наушники-клипсы

14.05. Oppo может получить улучшенную квадратную фронталку разрешением 100 МП

14.05. Vivo Y60 – бюджетник с экраном 120 Гц и АКБ 6500 мАч

13.05. Nubia GT Buds – прозрачный дизайн, RGB-подсветка и ANC за $39