Искусственный интеллект: Nvidia готовит процессор для инференса на базе технологий Groq, OpenAI станет якорным клиентом

MForum.ru

Искусственный интеллект: Nvidia готовит процессор для инференса на базе технологий Groq, OpenAI станет якорным клиентом

04.03.2026, MForum.ru


В преддверии ежегодной конференции GTC, которая пройдет в марте в Сан-Хосе, стало известно - Nvidia, безусловный лидер рынка AI-ускорителей, готовится представить новый класс процессоров, специально разработанных для задач инференса моделей ИИ. Основой новой платформы станет архитектура LPU (от англ. Language Processing Unit), которую Nvidia получила в рамках сделки со стартапом Grok.

Информация просачивалась и ранее, еще в декабре 2025 года стало известно о том, что Nvidia ведет переговоры о приобретении AI-чип стартапа Groq примерно за $20 млрд. В итоге эти деньги были выплачены за неэксклюзивную лицензию на технологии Groq, связанные с инференесом. Говорят, что так было сделано, чтобы обойти антимонопольщиков, которые возбудились бы на сделку с поглощением Groq. Так что Groq как компания продолжит независимое существование, но сосредоточившись на облачном сервисе GroqCloud.

Что такое LPU и почему это важно?

Groq LPU (Language Processing Unit) — это процессор, изначально спроектированный для максимально быстрого выполнения последовательных вычислений, необходимых для работы больших языковых моделей (LLM).

В основе LPU лежит архитектура Temporal Instruction Set Computer (TISC). Вместо того чтобы полагаться на дорогую и «медленную» (в контексте скорости работы ядер) память HBM (High Bandwidth Memory), как это делают GPU, LPU использует сверхбыструю статическую память (SRAM), расположенную непосредственно на кристалле.

Если в GPU обработка запросов может приводить к «дрожанию» (от англ. jitter) — нестабильному времени отклика, то LPU работает детерминированно: время выполнения каждой инструкции известно с точностью до наносекунды. Это принципиально важно для real-time приложений, таких как голосовые помощники или автопилоты.

Тесты Groq показали, что их системы способны выдавать более 500 токенов в секунду при работе с открытыми моделями, что в разы быстрее существующих решений на GPU.

Конечно, в Nvidia не смогли пройти мимо, иначе доминирование компании на рынке ИИ-чипов оказалось бы под угрозой (оно все равно под угрозой, уж очень о лакомой доле рынка идет речь, но сейчас конкурентам придется из кожи вон лезть, тогда как Nvidia может еще более укрепить свои позиции.

Интеграция Groq LPU позволит объединить «грубую силу» GPU для сложных вычислений с молниеносной реакцией LPU для выдачи результата. Ожидается, что гибридная система будет представлена как часть новой платформы на базе архитектуры Vera Rubin.

OpenAI делает ставку на обновленную Nvidia

Ключевым фактором, подтверждающим серьезность намерений Nvidia, стало согласие OpenAI стать крупнейшим клиентом, закупающим новые процессоры.

Этот шаг выглядит логичным в контексте недавней истории отношений двух компаний. В 2025 году Nvidia объявила о намерении инвестировать в инфраструктуру OpenAI до $100 млрд, это заложило основу для еще более тесной интеграции.

Хотя в конце 2025 - начале 2026 года OpenAI активно диверсифицировала риски, заключив многомиллиардные сделки с конкурентами Nvidia - Cerebras, AMD и Broadcom - сотрудничество с Nvidia остается для неё «фундаментальным».

OpenAI планирует использовать новую платформу Nvidia для улучшения своих инструментов генерации кода, в частности, для ускорения работы Codex.

💎 Успех интеграции будет зависеть от того, насколько гладко Nvidia сможет «подружить» программную экосистему Groq с собственным гигантским стеком CUDA. Если все получится, возникнет процессор, который сделает взаимодействие с ИИ практически мгновенным.

Официальный анонс новой платформы ожидается на конференции GTC (GPU Technology Conference) в марте 2026 года. ||

--

теги: микроэлектроника искусственный интеллект Nvidia инференс LPU горизонты технологий

--

© Алексей Бойко, MForum.ru


Публикации по теме:

16.03. Бесшовный фотонный интерфейс чип-окружающая среда: прорывы 2025–2026 годов

12.03. UMC и HyperLight объединили усилия для массового производства чиплетов на основе TFLN

12.03. IBM и Lam Research объединяют усилия для разработки логики суб-1 нм

10.03. Европа и Китай синхронно демонстрируют успех лазерной связи с геостационарными спутниками

10.03. Потери света в фотонных чипах приближены к показателям оптоволокна

07.03. В Новосибирске разработали устройство, позволяющее исследовать оптические свойства материалов для микроэлектроники терагерцевых частот

06.03. China Mobile представила на MWC2026 маршрутизатор 115,2 Тбит/с для соединения ИИ-кластеров и технологию GSE-DCI

04.03. Нейросетевой кодек NESC обещает эпоху массовой спутниковой связи

03.03. В Сибири изучают возможности создания элементов памяти на квантовых точках

02.03. Nokia, Samsung, MSI хотят интегрировать ИИ в RAN, а Nvidia хочет в телеком – просматривается кейс win-win

27.02. В Пекинском университете создали лабораторный прототип транзистора FeFET с графеновым затвором длиной 1нм

24.02. ASML добилась удвоения мощности источника света в EUV-машинах

24.02. В 2026 году в России может появиться фотолитограф нового поколения?

17.02. В Европе разработали новый класс полупроводников на базе GeSn

09.02. Интерфейс «мозг-компьютер» (ИМК) и влияние этого сегмента на рынок микроэлектроники

04.02. Кремниевый чип разогнали до 140 ГГц

03.02. SpaceX намеревается создать распределенный ИИ на орбитах о 500 до 2000 км

02.02. Alstom и Deutsche Bahn использовали выделенную сеть 5G SA для удаленного управления пригородным поездом

11.01. Учёные МФТИ открыли путь к лазерам на алмазах

04.01. Вертикальные 2T0C-ячейки и архитектура 4F²: путь к монолитной 3D DRAM

Обсуждение (открыть в отдельном окне)

В форуме нет сообщений.

Новое сообщение:
Complete in 1 ms, lookup=0 ms, find=1 ms

Последние сообщения в форумах

Все форумы »



Поиск по сайту:


Колонка редактора

04.05. FCC обновляет правила использования спутниковой связи - в SpaceX открывают шампанское

04.05. Ловушка "вайбкодинга" и чего ждать в плане цен на доступ к ИИ

04.05. Информагентство «Россия сегодня» развернуло локальную ИИ инфраструктуру на базе серверов Yadro

04.05. Huawei ожидает, что выручка от ИИ-чипов в 2026 году вырастет, минимум, на 60%

04.05. МТС в Воронежской области - сеть LTE расширена отечественными базовыми станциями

04.05. МегаФон в Республике Бурятия - покрытие 4G расширено новыми базовыми станциями в сёлах Мостовка и Зырянск

03.05. Созвездие Amazon Leo стало расти быстрее – взят барьер в 300 КА на орбите

01.05. В интересах безопасности…

30.04. Рынок платного ТВ в 2025 году показал рост на фоне блокировок мобильного интернета

30.04. Китайская Lightelligence провела IPO и оценена в 77.9 млрд гонконгских долларов

30.04. Прямая запись углеродных проводников на стеклянных подложках ускорит внедрение совместной упаковки оптики

30.04. Британская EE подключила к сети 5G+ более 50 млн человек

30.04. "Билайн бизнес" представил проект решения для управления горными работами pLTE/5G

30.04. МТС в Омской области - покрытие LTE улучшено рефармингом на юге региона

29.04. Разработку САПР под техпроцессы до 90 нм профинансирует Минпромторг

Все статьи >>


Новости

04.05. 7 мая представят Huawei Nova 15 Max – 8500 мАч, 50 МП RYYB и AMOLED

04.05. Moto G47 – 108 МП камера, FHD+ 120 Гц, Dimensity 6300 и защита MIL-STD-810H

04.05. iPhone Pro (2027) –изогнутый с 4-х сторон экран и подэкранная камера?

30.04. Tecno Spark 50 Pro 5G – Helio G100 Ultimate, 60 Вт и дизайн от Pova Curve 2

30.04. Официальные рендеры Moto G87 раскрывают 200 МП камеру, OLED-экран и дизайн как у G86

29.04. Poco C81 Pro – 6.9" 120 Гц, 6000 мАч и Unisoc T7250 за $99

29.04. Vivo TWS 5i – 50 часов работы, DeepX 3.0 и Bluetooth 5.4 за 17 долларов

29.04. Vivo Y600 Pro получил АКБ 10 200 мАч с зарядкой 90 Вт и IP69 при толщине 8.25 мм

29.04. Vivo Y600 Pro получил АКБ 10 200 мАч с зарядкой 90 Вт и IP69 при толщине 8.25 мм

28.04. Huawei Mate XT 2 – тройной складной смартфон с Kirin 9050 Pro и батареей 6000+ мАч

28.04. Geekbench раскрыл детали о Xiaomi 17T – Dimensity 8500, 12 ГБ RAM и Android 16

28.04. Vivo Y500s – 7200 мАч, IP68/IP69 и 50 МП камера за 265 долларов

27.04. Poco C81 и C81x – два бюджетных 4G-смартфона с 120 Гц, большими батареями и ценой от 105 долларов

27.04. Infinix GT 50 Pro – игровые триггеры, Dimensity 8400 Ultimate и жидкостное охлаждение за 406 долларов

27.04. Vivo Y6 5G – 7200 мАч, 120 Гц, "дышащий свет" и защита IP69 за 225 евро

24.04. Honor 600 и 600 Pro – 200 МП камера, IP69K и дизайн в стиле iPhone 17 Pro

24.04. Poco M8s 5G – 7000 мАч, 144 Гц и Snapdragon 6s Gen 3 за $189

24.04. iPhone 18 получит дисплей M12+, как у iPhone 14 Pro, а Pro-версии — новый M16

23.04. OnePlus Watch 4 – титановый корпус, Wear OS 6 и 16 дней работы

23.04. Motorola Edge 70 Pro – 6500 мАч, 90 Вт, три 50 МП камеры и защита IP69