MForum.ru
04.03.2026,
В преддверии ежегодной конференции GTC, которая пройдет в марте в Сан-Хосе, стало известно - Nvidia, безусловный лидер рынка AI-ускорителей, готовится представить новый класс процессоров, специально разработанных для задач инференса моделей ИИ. Основой новой платформы станет архитектура LPU (от англ. Language Processing Unit), которую Nvidia получила в рамках сделки со стартапом Grok.
Информация просачивалась и ранее, еще в декабре 2025 года стало известно о том, что Nvidia ведет переговоры о приобретении AI-чип стартапа Groq примерно за $20 млрд. В итоге эти деньги были выплачены за неэксклюзивную лицензию на технологии Groq, связанные с инференесом. Говорят, что так было сделано, чтобы обойти антимонопольщиков, которые возбудились бы на сделку с поглощением Groq. Так что Groq как компания продолжит независимое существование, но сосредоточившись на облачном сервисе GroqCloud.
Что такое LPU и почему это важно?
Groq LPU (Language Processing Unit) — это процессор, изначально спроектированный для максимально быстрого выполнения последовательных вычислений, необходимых для работы больших языковых моделей (LLM).
В основе LPU лежит архитектура Temporal Instruction Set Computer (TISC). Вместо того чтобы полагаться на дорогую и «медленную» (в контексте скорости работы ядер) память HBM (High Bandwidth Memory), как это делают GPU, LPU использует сверхбыструю статическую память (SRAM), расположенную непосредственно на кристалле.
Если в GPU обработка запросов может приводить к «дрожанию» (от англ. jitter) — нестабильному времени отклика, то LPU работает детерминированно: время выполнения каждой инструкции известно с точностью до наносекунды. Это принципиально важно для real-time приложений, таких как голосовые помощники или автопилоты.
Тесты Groq показали, что их системы способны выдавать более 500 токенов в секунду при работе с открытыми моделями, что в разы быстрее существующих решений на GPU.
Конечно, в Nvidia не смогли пройти мимо, иначе доминирование компании на рынке ИИ-чипов оказалось бы под угрозой (оно все равно под угрозой, уж очень о лакомой доле рынка идет речь, но сейчас конкурентам придется из кожи вон лезть, тогда как Nvidia может еще более укрепить свои позиции.
Интеграция Groq LPU позволит объединить «грубую силу» GPU для сложных вычислений с молниеносной реакцией LPU для выдачи результата. Ожидается, что гибридная система будет представлена как часть новой платформы на базе архитектуры Vera Rubin.
OpenAI делает ставку на обновленную Nvidia
Ключевым фактором, подтверждающим серьезность намерений Nvidia, стало согласие OpenAI стать крупнейшим клиентом, закупающим новые процессоры.
Этот шаг выглядит логичным в контексте недавней истории отношений двух компаний. В 2025 году Nvidia объявила о намерении инвестировать в инфраструктуру OpenAI до $100 млрд, это заложило основу для еще более тесной интеграции.
Хотя в конце 2025 - начале 2026 года OpenAI активно диверсифицировала риски, заключив многомиллиардные сделки с конкурентами Nvidia - Cerebras, AMD и Broadcom - сотрудничество с Nvidia остается для неё «фундаментальным».
OpenAI планирует использовать новую платформу Nvidia для улучшения своих инструментов генерации кода, в частности, для ускорения работы Codex.
💎 Успех интеграции будет зависеть от того, насколько гладко Nvidia сможет «подружить» программную экосистему Groq с собственным гигантским стеком CUDA. Если все получится, возникнет процессор, который сделает взаимодействие с ИИ практически мгновенным.
Официальный анонс новой платформы ожидается на конференции GTC (GPU Technology Conference) в марте 2026 года. ||
--
теги: микроэлектроника искусственный интеллект Nvidia инференс LPU горизонты технологий
--
Публикации по теме:
16.03. Бесшовный фотонный интерфейс чип-окружающая среда: прорывы 2025–2026 годов
12.03. UMC и HyperLight объединили усилия для массового производства чиплетов на основе TFLN
12.03. IBM и Lam Research объединяют усилия для разработки логики суб-1 нм
10.03. Европа и Китай синхронно демонстрируют успех лазерной связи с геостационарными спутниками
10.03. Потери света в фотонных чипах приближены к показателям оптоволокна
04.03. Нейросетевой кодек NESC обещает эпоху массовой спутниковой связи
03.03. В Сибири изучают возможности создания элементов памяти на квантовых точках
24.02. ASML добилась удвоения мощности источника света в EUV-машинах
24.02. В 2026 году в России может появиться фотолитограф нового поколения?
17.02. В Европе разработали новый класс полупроводников на базе GeSn
09.02. Интерфейс «мозг-компьютер» (ИМК) и влияние этого сегмента на рынок микроэлектроники
04.02. Кремниевый чип разогнали до 140 ГГц
03.02. SpaceX намеревается создать распределенный ИИ на орбитах о 500 до 2000 км
11.01. Учёные МФТИ открыли путь к лазерам на алмазах
04.01. Вертикальные 2T0C-ячейки и архитектура 4F²: путь к монолитной 3D DRAM
14.04. Telegram в России получит еще одну отсрочку?
14.04. МегаФон в Удмуртии - покрытие сотовой связи расширено новым оборудованием в Ижевске
14.04. МТС в Волгоградской области - интернет ускорен новой базовой станцией на острове Зеленый
14.04. Т-Мобайл подключается к Билайн
13.04. В нефтегазохимическом секторе доля закупок ИТ-оборудования выросла почти в 1,5 раза
13.04. Инженеры USC создали чип памяти, работающий при температуре 700 °C
13.04. Rapidus запускает прототипную линию бэк-энда
13.04. Билайн в Самарской области - покрытие 4G усилено на федеральной трассе М-5
13.04. МТС поделилась динамикой прироста аудитории новых для россиян мессенджеров
13.04. МегаФон в Челябинской области - покрытие 4G улучшено на озере Кременкуль
10.04. Использование Starlink растет в некоторых городских районах США
14.04. Redmi A7 Pro 5G – HyperOS 3, Unisoc T8300 и 6300 мАч за 11 499 рупий
14.04. Oppo Pad Mini с 8.8-дюймовым OLED-экраном 144 Гц и Snapdragon 8 Gen 5 представят 21 апреля
14.04. Rollme G9 – умные часы с офлайн-картами, двухдиапазонным GNSS и весом 32 грамма
13.04. Realme Narzo 100 Lite 5G – 7000 мАч "Titan Battery", 144 Гц и Dimensity 6300 за 13 000 рупий
13.04. CMF Phone 3 Pro получит Snapdragon 7s Gen 4 и металлическую рамку
13.04. Анонс Huawei Pura 90 Pro ожидается 20 апреля
10.04. Realme C100 4G – в000 мАч, IP69K и Helio G92 Max за 292 доллара
10.04. AI+ Nova 2 и Nova 2 Ultra – два подхода к бюджетному сегменту в Индии
10.04. Oppo A6s Pro – OLED, 7000 мАч, 80 Вт и Dimensity 6300
09.04. Moto Pad 2026 – 2.5K-экран, 5G и четыре динамика за 250 долларов
09.04. Motorola Moto G Stylus (2026) – стилус с наклоном, защита IP69 и AMOLED за 500 долларов
08.04. Oppo A6k с АКБ 7000 мАч, экраном 120 Гц и Dimensity 6300 оценен 290 долларов
08.04.
Tecno наконец раскрыла график обновления до Android 16 — с опозданием на поколение
08.04. Представлен Realme C100 5G с АКБ 7000 мАч, 144 Гц экраном и Dimensity 6300 за 215 долларов
07.04. Oppo F33 Pro 5G – IP69K, 50 МП фронталка и батарея 7000 мАч за 35 000 рупий
07.04. Redmi A7 Pro 5G с батареей 6300 мАч и Circle to Search выходит в Индии
06.04. Vivo T5 Pro с АКб 9020 мАч – "ультимативная мощь" или маркетинг?
06.04. Oppo A6c выходит на глобальный рынок
03.04. Honor Play 80 Pro – 7000 мАч и IP65, но экран 60 Гц и Android 15
03.04. Первые тизеры раскрывают ультратонкий дизайн Honor 600 Series