Вычислительная техника: В Yadro успешно протестировали GigaChat на новых ИИ-серверах собственной разработки

MForum.ru

Вычислительная техника: В Yadro успешно протестировали GigaChat на новых ИИ-серверах собственной разработки

03.02.2026, MForum.ru


Yadro объявила об успешной валидации работы on-prem версии нейросетевой модели GigaChat от Сбера на платформе своего нового ИИ-сервера Yadro G4208P G3. Тестирование подтвердило готовность новых серверов к эксплуатации в корпоративных инфраструктурах с повышенными требованиями к производительности при работе с передовыми моделями искусственного интеллекта. 

 

ИИ сервер Yadro G4208P G3

 

Тесты проводились группой компаний ЦРТ на базе операционных систем Astra Linux и Platform V SberLinux. В составе тестовой конфигурации использовались четыре графические карты, обеспечивавшие необходимый уровень производительности при работе с моделью. Пилотный проект подтвердил готовность серверов к работе с современными ИИ-нагрузками — от анализа больших данных до прикладного использования ML-решений.

В ходе нагрузочных испытаний сервис GigaChat на сервере Yadro G4208P G3 показал устойчивую работу под реальной нагрузкой. Во всех тестовых сценариях не зафиксировано ни одного сбоя или отфильтрованного запроса: суммарно успешно обработано более 7 тысяч запросов для разных конфигураций моделей.

Наиболее сбалансированные результаты показала модель GigaChat Max2 в конфигурации FP16. При увеличении числа параллельных запросов до 25 потоков система продолжает наращивать пропускную способность, достигая до 48,5 запросов в минуту, при этом задержки растут контролируемо и остаются ниже, чем у других протестированных конфигураций.

Важно учитывать характер нагрузки: медианная длина ответа составляет 550–650 токенов, то есть это развернутые тексты, а не короткие реплики. Скорость генерации находится на уровне 19–30 мс на токен, что соответствует 33–50 токенам в секунду на поток. Поэтому суммарная задержка в десятки секунд обусловлена в первую очередь объемом генерируемого текста и очередью при высокой параллельности, а не низкой производительностью оборудования.

Полученные результаты имеют особое значение для корпоративных заказчиков, заинтересованных в развертывании GigaChat в собственных ЦОД. Для них дополнительным преимуществом является то, что серверы Yadro G4208P G3 включены в Единый реестр российской радиоэлектронной продукции Минпромторга. Это подтверждает их соответствие критериям импортозамещения и позволяет использовать оборудование в проектах с особыми требованиями к локализации. Таким образом, приобретение on-prem модели GigaChat органично сочетается с выбором ИИ-сервера Yadro, формируя комплексное отечественное решение для внедрения искусственного интеллекта в корпоративных и государственных инфраструктурах.

Дмитрий Дырмовский, генеральный директор группы компаний ЦРТ: «Ключевой запрос крупного бизнеса и госсектора — внедрение прогрессивных отечественных решений на основе генеративного искусственного интеллекта. Актуальный тренд — внедрение облачных решений, но при повышенных требованиях к безопасности формируется спрос на on-prem-внедрения — установку в закрытый контур организаций. Появление полноценной российской GPU-платформы помогает удовлетворить такой спрос. Результаты тестирования on-prem модели GigaChat c cерверами Yadro позволили нам убедиться в их совместимости и высокой эффективности, а главное — открыть для всех наших клиентов комплексное решение, включающее нейросетевую модель Сбера GigaChat и инфраструктуру YADRO для безопасного внедрения новейших GenAI-решений».

Павел Егоров, директор по продуктам компании Yadro: «Растущий интерес бизнеса к внедрению искусственного интеллекта в ключевые процессы всё чаще приводит участников ИТ-рынка к осознанию необходимости развёртывания генеративных и корпоративных моделей в собственных инфраструктурах. Для этого требуются производительные и надёжные решения, адаптированные для быстрого и безопасного внедрения в существующую ИТ-среду. Успешная интеграция GigaChat с нашими серверами показала, что такие задачи уже могут эффективно решаться на базе отечественного оборудования: архитектура нового ИИ-сервера Yadro обеспечивает высокую производительность и стабильность при длительных нагрузках, а гибкая конфигурация позволяет адаптировать систему под конкретные требования. Развивая такие проекты, в партнёрстве с ведущими игроками рынка мы формируем устойчивую технологическую базу, которая позволяет отечественным решениям уверенно конкурировать и развиваться на уровне мировых стандартов».

Поддержка до 8 GPU, высокоскоростные соединения NVLink Bridge, современные процессоры (CPU) и память DDR5 соответствуют архитектуре ведущих зарубежных ИИ-серверов (например, Dell PowerEdge XE9680). При этом российский сервер - реестровый и готов к работе с разным ПО, включая российские ОС и платформы. В полной конфигурации - это флагманское и дорогое решение для сложных задач.

Если придираться, то стоит отметить, что высокая производительность определяется доступностью импортных GPU. Но... альтернатив импорту в этом плане пока что нет. 

--

За новостями наземного и спутникового телекома удобно следить в телеграм-канале abloud62. Региональные новости телекома, новости искусственного интеллекта и ЦОД вы найдете в канале abloudRealTime, новости микроэлектроники можно найти в моем канале RUSmicro, также подключайтесь к каналу Бойко про телеком ВКонтакте

теги искусственный интеллект вычислительная техника сервера Yadro GigaChat

-- 

© Алексей Бойко, MForum.ru


Публикации по теме:

10.02. Сбербанк может вложить в создание нового суперкомпьютера до 0.5 трлн

09.02. Yadro объявляет о поддержке ИИ ускорителей Nvidia H200 и Nvidia RTX PRO 6000 Blackwell SE в своих серверах

08.02. Ожидается, что квантовые вычисления станут ключевой технологией следующего поколения для решения сложных задач будущего

27.01. Серверы и СХД Yadro прошли тестирование в администрации Южно-Сахалинска

16.12. Китай запустил крупнейший в мире распределенный ИИ-суперкомпьютер

11.12. МИЭТ и Yadro открыли совместную научно-исследовательскую лабораторию

27.11. Европа наращивает мощности в квантовой гонке: IQM инвестирует в расширение производства в Финляндии

31.10. Минэнерго США в партнерстве с AMD планирует построить два суперкомпьютера с инвестициями в $1 млрд

28.10. Yadro объявляет о начале серийных продаж ПК Kvarda Tau mini в форм-факторе Ultra Small

14.05. В АРПЭ оценили российский рынок серверов и говорят, что он сокращается второй год подряд

10.02. Продажи ПК в РФ в 2024 году выросли на 22% до 3 млн штук

22.01. В Испании пытаются обустроить собственную микроэлектронику

21.11. ФЦПРИИ закупит сервера и телеком-оборудование для обучения ИИ на 665 млн рублей

13.11. В МВД недовольны серверами на процессорах Эльбрус и сложностями в их получении

06.03. Аквариус выпустил первые сервера линейки MEC

18.07. «Казахстанским серверам» не повторить успеха «белорусских креветок»

24.11. Конспекты: В.Богданов, "Созвездие "Байкал". Экосистема ПО для процессоров Baikal. Текущее состояние и перспективы"

22.11. Intel опубликовала обновление драйвера Software Defined Silicon

19.11. Яндекс становится еще одним участником быстро растущего рынка российских серверов

15.02. Компания ДЕПО Компьютерс анонсирует новые серверы и СХД ДЕПО на базе отечественных процессоров Эльбрус

Обсуждение (открыть в отдельном окне)

В форуме нет сообщений.

Новое сообщение:
Complete in 2 ms, lookup=0 ms, find=2 ms

Последние сообщения в форумах

Все форумы »



Поиск по сайту:


Колонка редактора

24.03. Билайн в Санкт-Петербурге - мобильный интернет оператора в метро признан лучшим по оценкам DMTEL

24.03. Билайн бизнес сообщает о расширении возможностей связи для предпринимателей

24.03. Кризис расползается по цепочке поставок

24.03. TSMC наращивает мощности в США, спрос на чипы высок, а выручка в 2026 году может вырасти на 30%

24.03. МТС в Приморском крае организовал новый трансграничный переход интернет-трафика с China Mobile

24.03. Практика российских бигтехов – только 7-10% пилотных ИИ-проектов 2025 года дошли до полноценного внедрения

24.03. Запущены первые 16 спутников БЮРО 1440

23.03. В России могут начать работы над литографом для техпроцесса 90 нм в 2026 году

23.03. Samsung Electronics вложит рекордные 110 трлн вон

23.03. МТС разместила биржевые облигации серии 002P-17 на 10 млрд

23.03. Билайн в Нижегородской области - покрытие 4G расширено в столице и в сельских населенных пунктах

23.03. Бельгийская imec получила в свое распоряжение ASML High NA EUV

23.03. МегаФон в Татарстане - сеть LTE в Казани получила дополнительные частоты

23.03. Минпромторг планирует ужесточить критерии локализации производства печатных плат – к чему это может привести

23.03. Суд оштрафовал заблокированный в РФ Telegram. В очередной раз

Все статьи >>


Новости

24.03. Huawei Enjoy 90 Plus и Enjoy 90 – Kirin 8000, батареи 6620 мАч и доступные цены

24.03. Huawei Enjoy 90 Pro Max – Kirin 8000, батарея 8500 мАч и экран 120 Гц за 250 долларов

23.03. Redmi 15A 5G – 6300 мАч и 120 Гц за «реальные деньги»

23.03. Xiaomi 17T и 17T Pro засветились в IMDA

20.03. Lenovo представила компактный Y700 с двумя USB-C и большие Xiaoxin Pro

20.03. iQOO Z11 с батареей 9020 мАч и экраном 165 Гц представят 26 марта

19.03. Ulefone RugKing 5 Pro – 20 000 мАч, 1202 светодиода и ночное видение за 270 долларов

19.03. Oppo A6s 5G – 80-ваттная зарядка и IP69 за 18 999 рупий

19.03. FOSSiBOT F116 Pro – компактный защищенный смартфон с креплением для экшн-камеры

18.03. Samsung Galaxy M17e 5G – ребрендинг A07 с батареей 6000 мАч за 140 долларов

18.03. Oppo Watch X3 – титан, сапфир и мониторинг глюкозы

18.03. Oppo Find N6 появился на глобальном рынке

17.03. Представлен Vivo Y51 Pro 5G с батареей 7200 мАч и защитой IP69

17.03. iQOO Z11x 5G – батарея 7200 мАч и мощный чип за 205 долларов

17.03. Realme C100 5G с экраном 144 Гц и АКБ 7000 мАч засветился у европейского ритейлера

16.03. Представлен Lava Bold 2 5G с плоским экраном, чистым Android и демократичной ценой

16.03. Раскрыты характеристики Oppo Pad 5 Pro – мощный планшет с батареей 13 000 мАч

16.03. Nubia набирает тестировщиков OpenClaw AI на Z80 Ultra

13.03. Представлен Motorola Edge 70 Fusion+ с улучшенной камерой

13.03. Energizer P30K Apex, смартфон с батареей 30 000 мАч, ожидается в июне