Искусственный интеллект: Nvidia готовит процессор для инференса на базе технологий Groq, OpenAI станет якорным клиентом

MForum.ru

Искусственный интеллект: Nvidia готовит процессор для инференса на базе технологий Groq, OpenAI станет якорным клиентом

04.03.2026, MForum.ru


В преддверии ежегодной конференции GTC, которая пройдет в марте в Сан-Хосе, стало известно - Nvidia, безусловный лидер рынка AI-ускорителей, готовится представить новый класс процессоров, специально разработанных для задач инференса моделей ИИ. Основой новой платформы станет архитектура LPU (от англ. Language Processing Unit), которую Nvidia получила в рамках сделки со стартапом Grok.

Информация просачивалась и ранее, еще в декабре 2025 года стало известно о том, что Nvidia ведет переговоры о приобретении AI-чип стартапа Groq примерно за $20 млрд. В итоге эти деньги были выплачены за неэксклюзивную лицензию на технологии Groq, связанные с инференесом. Говорят, что так было сделано, чтобы обойти антимонопольщиков, которые возбудились бы на сделку с поглощением Groq. Так что Groq как компания продолжит независимое существование, но сосредоточившись на облачном сервисе GroqCloud.

Что такое LPU и почему это важно?

Groq LPU (Language Processing Unit) — это процессор, изначально спроектированный для максимально быстрого выполнения последовательных вычислений, необходимых для работы больших языковых моделей (LLM).

В основе LPU лежит архитектура Temporal Instruction Set Computer (TISC). Вместо того чтобы полагаться на дорогую и «медленную» (в контексте скорости работы ядер) память HBM (High Bandwidth Memory), как это делают GPU, LPU использует сверхбыструю статическую память (SRAM), расположенную непосредственно на кристалле.

Если в GPU обработка запросов может приводить к «дрожанию» (от англ. jitter) — нестабильному времени отклика, то LPU работает детерминированно: время выполнения каждой инструкции известно с точностью до наносекунды. Это принципиально важно для real-time приложений, таких как голосовые помощники или автопилоты.

Тесты Groq показали, что их системы способны выдавать более 500 токенов в секунду при работе с открытыми моделями, что в разы быстрее существующих решений на GPU.

Конечно, в Nvidia не смогли пройти мимо, иначе доминирование компании на рынке ИИ-чипов оказалось бы под угрозой (оно все равно под угрозой, уж очень о лакомой доле рынка идет речь, но сейчас конкурентам придется из кожи вон лезть, тогда как Nvidia может еще более укрепить свои позиции.

Интеграция Groq LPU позволит объединить «грубую силу» GPU для сложных вычислений с молниеносной реакцией LPU для выдачи результата. Ожидается, что гибридная система будет представлена как часть новой платформы на базе архитектуры Vera Rubin.

OpenAI делает ставку на обновленную Nvidia

Ключевым фактором, подтверждающим серьезность намерений Nvidia, стало согласие OpenAI стать крупнейшим клиентом, закупающим новые процессоры.

Этот шаг выглядит логичным в контексте недавней истории отношений двух компаний. В 2025 году Nvidia объявила о намерении инвестировать в инфраструктуру OpenAI до $100 млрд, это заложило основу для еще более тесной интеграции.

Хотя в конце 2025 - начале 2026 года OpenAI активно диверсифицировала риски, заключив многомиллиардные сделки с конкурентами Nvidia - Cerebras, AMD и Broadcom - сотрудничество с Nvidia остается для неё «фундаментальным».

OpenAI планирует использовать новую платформу Nvidia для улучшения своих инструментов генерации кода, в частности, для ускорения работы Codex.

💎 Успех интеграции будет зависеть от того, насколько гладко Nvidia сможет «подружить» программную экосистему Groq с собственным гигантским стеком CUDA. Если все получится, возникнет процессор, который сделает взаимодействие с ИИ практически мгновенным.

Официальный анонс новой платформы ожидается на конференции GTC (GPU Technology Conference) в марте 2026 года. ||

--

теги: микроэлектроника искусственный интеллект Nvidia инференс LPU горизонты технологий

--

© Алексей Бойко, MForum.ru


Публикации по теме:

04.03. [Новости компаний] Горизонты технологий: Нейросетевой кодек NESC обещает эпоху массовой спутниковой связи / MForum.ru

03.03. [Новости компаний] Микроэлектроника: В Сибири изучают возможности создания элементов памяти на квантовых точках / MForum.ru

02.03. [Новости компаний] Горизонты технологий: Nokia, Samsung, MSI хотят интегрировать ИИ в RAN, а Nvidia хочет в телеком – просматривается кейс win-win / MForum.ru

27.02. [Новости компаний] Микроэлектроника: В Пекинском университете создали лабораторный прототип транзистора FeFET с графеновым затвором длиной 1нм / MForum.ru

24.02. [Новости компаний] Микроэлектроника: ASML добилась удвоения мощности источника света в EUV-машинах / MForum.ru

Обсуждение (открыть в отдельном окне)

В форуме нет сообщений.

Новое сообщение:
Complete in 2 ms, lookup=0 ms, find=2 ms

Последние сообщения в форумах

Все форумы »



Поиск по сайту:

Подписка:

Подписаться
Отписаться


Новости

04.03. [Новинки] Слухи: Honor 600 Lite полностью раскрыт до анонса / MForum.ru

04.03. [Новинки] MWC 2026: TECNO представляет OneLeap, MEGAPAD 2, Watch GT 1S и FreeHear 2 / MForum.ru

04.03. [Новинки] Анонсы: Рикор представил два смартфона для российского потребительского рынка / MForum.ru

04.03. [Новинки] Анонсы: Oppo A6s Pro получил 50-мегапиксельнцю ультраширокоугольную селфи-камеру / MForum.ru

03.03. [Новинки] Анонсы: Tecno Camon 50 Ultra 5G — 144 Гц, двойные 50-мегапиксельные камеры, батарея 6500 мАч и защита IP69K / MForum.ru

03.03. [Новинки] Слухи: Samsung готовит 200-мегапиксельный сенсор ISOCELL HPA с размером 1/1.12 дюйма и технологией LOFIC / MForum.ru

02.03. [Новинки] Анонсы: Apple представила iPhone 17e — A19, 256 ГБ базовой памяти и MagSafe за 600 долларов / MForum.ru

02.03. [Новинки] MWC 2026: Honor Magic V6 — первый в мире складной смартфон с защитой IP68/IP69, Snapdragon 8 Elite Gen 5 и батареей 6660 мАч / MForum.ru

02.03. [Новинки] Анонсы: Honor MagicPad 4 — первый в мире планшет на Snapdragon 8 Gen 5 / MForum.ru

02.03. [Новинки] Анонсы: Redmi A7 Pro 4G появился в Индонезии — 120 Гц, батарея 6000 мАч и яркий дизайн за $90 / MForum.ru

27.02. [Новинки] Анонсы: Samsung Galaxy S26 Ultra — приватный дисплей, быстрая зарядка 60 Вт и светосильная камера / MForum.ru

27.02. [Новинки] Анонсы: Samsung Galaxy S26 и S26+ — ставка на софт и минимальные аппаратные изменения / MForum.ru

26.02. [Новинки] MWC 2026: TECNO покажет самый тонкий смартфон с отстегивающимися модулями / Mforum.ru

26.02. [Новинки] Анонсы: Infinix Smart 20 получил экран 120 Гц, Helio G81 Ultimate и IP64 / MForum.ru

26.02. [Новинки] Слухи: Vivo тестирует смартфон с батареей до 12 000 мАч / MForum.ru

25.02. [Новинки] Анонс: iQOO 15R — первый «R» в линейке с компактным корпусом, Snapdragon 8 Gen 5 и батареей 7600 мАч / MForum.ru

25.02. [Новинки] Анонсы: Vivo Y05 получил экран 120 Гц, батарею 6500 мАч и IP65 при цене $109 / MForum.ru

25.02. [Новинки] Слухи: iPhone 18 Pro получит тёмно-красный цвет, а складной iPhone Fold ограничится классикой / MForum.ru

24.02. [Новинки] Анонсы: Motorola Edge 70 Fusion подтверждён на Flipkart — мировой дебют Sony LYT-710, 144 Гц и батарея 7000 мАч / MForum.ru

24.02. [Новинки]  Слухи: Samsung Galaxy A37 и A57 — сертификация IMDA подтверждает скорый анонс / MForum.ru