MForum.ru
03.02.2026,
Yadro объявила об успешной валидации работы on-prem версии нейросетевой модели GigaChat от Сбера на платформе своего нового ИИ-сервера Yadro G4208P G3. Тестирование подтвердило готовность новых серверов к эксплуатации в корпоративных инфраструктурах с повышенными требованиями к производительности при работе с передовыми моделями искусственного интеллекта.
Тесты проводились группой компаний ЦРТ на базе операционных систем Astra Linux и Platform V SberLinux. В составе тестовой конфигурации использовались четыре графические карты, обеспечивавшие необходимый уровень производительности при работе с моделью. Пилотный проект подтвердил готовность серверов к работе с современными ИИ-нагрузками — от анализа больших данных до прикладного использования ML-решений.
В ходе нагрузочных испытаний сервис GigaChat на сервере Yadro G4208P G3 показал устойчивую работу под реальной нагрузкой. Во всех тестовых сценариях не зафиксировано ни одного сбоя или отфильтрованного запроса: суммарно успешно обработано более 7 тысяч запросов для разных конфигураций моделей.
Наиболее сбалансированные результаты показала модель GigaChat Max2 в конфигурации FP16. При увеличении числа параллельных запросов до 25 потоков система продолжает наращивать пропускную способность, достигая до 48,5 запросов в минуту, при этом задержки растут контролируемо и остаются ниже, чем у других протестированных конфигураций.
Важно учитывать характер нагрузки: медианная длина ответа составляет 550–650 токенов, то есть это развернутые тексты, а не короткие реплики. Скорость генерации находится на уровне 19–30 мс на токен, что соответствует 33–50 токенам в секунду на поток. Поэтому суммарная задержка в десятки секунд обусловлена в первую очередь объемом генерируемого текста и очередью при высокой параллельности, а не низкой производительностью оборудования.
Полученные результаты имеют особое значение для корпоративных заказчиков, заинтересованных в развертывании GigaChat в собственных ЦОД. Для них дополнительным преимуществом является то, что серверы Yadro G4208P G3 включены в Единый реестр российской радиоэлектронной продукции Минпромторга. Это подтверждает их соответствие критериям импортозамещения и позволяет использовать оборудование в проектах с особыми требованиями к локализации. Таким образом, приобретение on-prem модели GigaChat органично сочетается с выбором ИИ-сервера Yadro, формируя комплексное отечественное решение для внедрения искусственного интеллекта в корпоративных и государственных инфраструктурах.
Дмитрий Дырмовский, генеральный директор группы компаний ЦРТ: «Ключевой запрос крупного бизнеса и госсектора — внедрение прогрессивных отечественных решений на основе генеративного искусственного интеллекта. Актуальный тренд — внедрение облачных решений, но при повышенных требованиях к безопасности формируется спрос на on-prem-внедрения — установку в закрытый контур организаций. Появление полноценной российской GPU-платформы помогает удовлетворить такой спрос. Результаты тестирования on-prem модели GigaChat c cерверами Yadro позволили нам убедиться в их совместимости и высокой эффективности, а главное — открыть для всех наших клиентов комплексное решение, включающее нейросетевую модель Сбера GigaChat и инфраструктуру YADRO для безопасного внедрения новейших GenAI-решений».
Павел Егоров, директор по продуктам компании Yadro: «Растущий интерес бизнеса к внедрению искусственного интеллекта в ключевые процессы всё чаще приводит участников ИТ-рынка к осознанию необходимости развёртывания генеративных и корпоративных моделей в собственных инфраструктурах. Для этого требуются производительные и надёжные решения, адаптированные для быстрого и безопасного внедрения в существующую ИТ-среду. Успешная интеграция GigaChat с нашими серверами показала, что такие задачи уже могут эффективно решаться на базе отечественного оборудования: архитектура нового ИИ-сервера Yadro обеспечивает высокую производительность и стабильность при длительных нагрузках, а гибкая конфигурация позволяет адаптировать систему под конкретные требования. Развивая такие проекты, в партнёрстве с ведущими игроками рынка мы формируем устойчивую технологическую базу, которая позволяет отечественным решениям уверенно конкурировать и развиваться на уровне мировых стандартов».
Поддержка до 8 GPU, высокоскоростные соединения NVLink Bridge, современные процессоры (CPU) и память DDR5 соответствуют архитектуре ведущих зарубежных ИИ-серверов (например, Dell PowerEdge XE9680). При этом российский сервер - реестровый и готов к работе с разным ПО, включая российские ОС и платформы. В полной конфигурации - это флагманское и дорогое решение для сложных задач.
Если придираться, то стоит отметить, что высокая производительность определяется доступностью импортных GPU. Но... альтернатив импорту в этом плане пока что нет.
--
За новостями наземного и спутникового телекома удобно следить в телеграм-канале abloud62. Региональные новости телекома, новости искусственного интеллекта и ЦОД вы найдете в канале abloudRealTime, новости микроэлектроники можно найти в моем канале RUSmicro, также подключайтесь к каналу Бойко про телеком ВКонтакте
теги искусственный интеллект вычислительная техника сервера Yadro GigaChat
--
Публикации по теме:
10.02. Сбербанк может вложить в создание нового суперкомпьютера до 0.5 трлн
27.01. Серверы и СХД Yadro прошли тестирование в администрации Южно-Сахалинска
16.12. Китай запустил крупнейший в мире распределенный ИИ-суперкомпьютер
11.12. МИЭТ и Yadro открыли совместную научно-исследовательскую лабораторию
27.11. Европа наращивает мощности в квантовой гонке: IQM инвестирует в расширение производства в Финляндии
31.10. Минэнерго США в партнерстве с AMD планирует построить два суперкомпьютера с инвестициями в $1 млрд
28.10. Yadro объявляет о начале серийных продаж ПК Kvarda Tau mini в форм-факторе Ultra Small
14.05. В АРПЭ оценили российский рынок серверов и говорят, что он сокращается второй год подряд
10.02. Продажи ПК в РФ в 2024 году выросли на 22% до 3 млн штук
22.01. В Испании пытаются обустроить собственную микроэлектронику
21.11. ФЦПРИИ закупит сервера и телеком-оборудование для обучения ИИ на 665 млн рублей
13.11. В МВД недовольны серверами на процессорах Эльбрус и сложностями в их получении
06.03. Аквариус выпустил первые сервера линейки MEC
18.07. «Казахстанским серверам» не повторить успеха «белорусских креветок»
22.11. Intel опубликовала обновление драйвера Software Defined Silicon
19.11. Яндекс становится еще одним участником быстро растущего рынка российских серверов
13.04. В нефтегазохимическом секторе доля закупок ИТ-оборудования выросла почти в 1,5 раза
13.04. Инженеры USC создали чип памяти, работающий при температуре 700 °C
13.04. Rapidus запускает прототипную линию бэк-энда
13.04. Билайн в Самарской области - покрытие 4G усилено на федеральной трассе М-5
13.04. МТС поделилась динамикой прироста аудитории новых для россиян мессенджеров
13.04. МегаФон в Челябинской области - покрытие 4G улучшено на озере Кременкуль
10.04. Использование Starlink растет в некоторых городских районах США
10.04. МТС в Забайкальском крае расширил сеть LTE в трёх округах
10.04. Ростелеком примеривается к стройке дата-центра мощностью 100 МВт
10.04. Amazon рассматривает возможности продажи собственных ИИ-чипов
10.04. Какие геостационарные аппараты запланированы к производству в России
14.04. Redmi A7 Pro 5G – HyperOS 3, Unisoc T8300 и 6300 мАч за 11 499 рупий
14.04. Oppo Pad Mini с 8.8-дюймовым OLED-экраном 144 Гц и Snapdragon 8 Gen 5 представят 21 апреля
14.04. Rollme G9 – умные часы с офлайн-картами, двухдиапазонным GNSS и весом 32 грамма
13.04. Realme Narzo 100 Lite 5G – 7000 мАч "Titan Battery", 144 Гц и Dimensity 6300 за 13 000 рупий
13.04. CMF Phone 3 Pro получит Snapdragon 7s Gen 4 и металлическую рамку
13.04. Анонс Huawei Pura 90 Pro ожидается 20 апреля
10.04. Realme C100 4G – в000 мАч, IP69K и Helio G92 Max за 292 доллара
10.04. AI+ Nova 2 и Nova 2 Ultra – два подхода к бюджетному сегменту в Индии
10.04. Oppo A6s Pro – OLED, 7000 мАч, 80 Вт и Dimensity 6300
09.04. Moto Pad 2026 – 2.5K-экран, 5G и четыре динамика за 250 долларов
09.04. Motorola Moto G Stylus (2026) – стилус с наклоном, защита IP69 и AMOLED за 500 долларов
08.04. Oppo A6k с АКБ 7000 мАч, экраном 120 Гц и Dimensity 6300 оценен 290 долларов
08.04.
Tecno наконец раскрыла график обновления до Android 16 — с опозданием на поколение
08.04. Представлен Realme C100 5G с АКБ 7000 мАч, 144 Гц экраном и Dimensity 6300 за 215 долларов
07.04. Oppo F33 Pro 5G – IP69K, 50 МП фронталка и батарея 7000 мАч за 35 000 рупий
07.04. Redmi A7 Pro 5G с батареей 6300 мАч и Circle to Search выходит в Индии
06.04. Vivo T5 Pro с АКб 9020 мАч – "ультимативная мощь" или маркетинг?
06.04. Oppo A6c выходит на глобальный рынок
03.04. Honor Play 80 Pro – 7000 мАч и IP65, но экран 60 Гц и Android 15
03.04. Первые тизеры раскрывают ультратонкий дизайн Honor 600 Series