MForum.ru
04.03.2026,
В преддверии ежегодной конференции GTC, которая пройдет в марте в Сан-Хосе, стало известно - Nvidia, безусловный лидер рынка AI-ускорителей, готовится представить новый класс процессоров, специально разработанных для задач инференса моделей ИИ. Основой новой платформы станет архитектура LPU (от англ. Language Processing Unit), которую Nvidia получила в рамках сделки со стартапом Grok.
Информация просачивалась и ранее, еще в декабре 2025 года стало известно о том, что Nvidia ведет переговоры о приобретении AI-чип стартапа Groq примерно за $20 млрд. В итоге эти деньги были выплачены за неэксклюзивную лицензию на технологии Groq, связанные с инференесом. Говорят, что так было сделано, чтобы обойти антимонопольщиков, которые возбудились бы на сделку с поглощением Groq. Так что Groq как компания продолжит независимое существование, но сосредоточившись на облачном сервисе GroqCloud.
Что такое LPU и почему это важно?
Groq LPU (Language Processing Unit) — это процессор, изначально спроектированный для максимально быстрого выполнения последовательных вычислений, необходимых для работы больших языковых моделей (LLM).
В основе LPU лежит архитектура Temporal Instruction Set Computer (TISC). Вместо того чтобы полагаться на дорогую и «медленную» (в контексте скорости работы ядер) память HBM (High Bandwidth Memory), как это делают GPU, LPU использует сверхбыструю статическую память (SRAM), расположенную непосредственно на кристалле.
Если в GPU обработка запросов может приводить к «дрожанию» (от англ. jitter) — нестабильному времени отклика, то LPU работает детерминированно: время выполнения каждой инструкции известно с точностью до наносекунды. Это принципиально важно для real-time приложений, таких как голосовые помощники или автопилоты.
Тесты Groq показали, что их системы способны выдавать более 500 токенов в секунду при работе с открытыми моделями, что в разы быстрее существующих решений на GPU.
Конечно, в Nvidia не смогли пройти мимо, иначе доминирование компании на рынке ИИ-чипов оказалось бы под угрозой (оно все равно под угрозой, уж очень о лакомой доле рынка идет речь, но сейчас конкурентам придется из кожи вон лезть, тогда как Nvidia может еще более укрепить свои позиции.
Интеграция Groq LPU позволит объединить «грубую силу» GPU для сложных вычислений с молниеносной реакцией LPU для выдачи результата. Ожидается, что гибридная система будет представлена как часть новой платформы на базе архитектуры Vera Rubin.
OpenAI делает ставку на обновленную Nvidia
Ключевым фактором, подтверждающим серьезность намерений Nvidia, стало согласие OpenAI стать крупнейшим клиентом, закупающим новые процессоры.
Этот шаг выглядит логичным в контексте недавней истории отношений двух компаний. В 2025 году Nvidia объявила о намерении инвестировать в инфраструктуру OpenAI до $100 млрд, это заложило основу для еще более тесной интеграции.
Хотя в конце 2025 - начале 2026 года OpenAI активно диверсифицировала риски, заключив многомиллиардные сделки с конкурентами Nvidia - Cerebras, AMD и Broadcom - сотрудничество с Nvidia остается для неё «фундаментальным».
OpenAI планирует использовать новую платформу Nvidia для улучшения своих инструментов генерации кода, в частности, для ускорения работы Codex.
💎 Успех интеграции будет зависеть от того, насколько гладко Nvidia сможет «подружить» программную экосистему Groq с собственным гигантским стеком CUDA. Если все получится, возникнет процессор, который сделает взаимодействие с ИИ практически мгновенным.
Официальный анонс новой платформы ожидается на конференции GTC (GPU Technology Conference) в марте 2026 года. ||
--
теги: микроэлектроника искусственный интеллект Nvidia инференс LPU горизонты технологий
--
Публикации по теме:
16.03. Бесшовный фотонный интерфейс чип-окружающая среда: прорывы 2025–2026 годов
12.03. UMC и HyperLight объединили усилия для массового производства чиплетов на основе TFLN
12.03. IBM и Lam Research объединяют усилия для разработки логики суб-1 нм
10.03. Европа и Китай синхронно демонстрируют успех лазерной связи с геостационарными спутниками
10.03. Потери света в фотонных чипах приближены к показателям оптоволокна
04.03. Нейросетевой кодек NESC обещает эпоху массовой спутниковой связи
03.03. В Сибири изучают возможности создания элементов памяти на квантовых точках
24.02. ASML добилась удвоения мощности источника света в EUV-машинах
24.02. В 2026 году в России может появиться фотолитограф нового поколения?
17.02. В Европе разработали новый класс полупроводников на базе GeSn
09.02. Интерфейс «мозг-компьютер» (ИМК) и влияние этого сегмента на рынок микроэлектроники
04.02. Кремниевый чип разогнали до 140 ГГц
03.02. SpaceX намеревается создать распределенный ИИ на орбитах о 500 до 2000 км
11.01. Учёные МФТИ открыли путь к лазерам на алмазах
04.01. Вертикальные 2T0C-ячейки и архитектура 4F²: путь к монолитной 3D DRAM
25.03. МегаФон в Красноярском крае - покрытие 4G расширено в 16 муниципальных округах
25.03. МТС в Республике Бурятия - мобильный интернет ускорен в курортном поселке Жемчуг
24.03. Норвежский стартап Lace Lithography привлек $40 млн на литографию с атомарным разрешением
24.03. Билайн в Санкт-Петербурге - мобильный интернет оператора в метро признан лучшим по оценкам DMTEL
24.03. Билайн бизнес сообщает о расширении возможностей связи для предпринимателей
24.03. Кризис расползается по цепочке поставок
24.03. TSMC наращивает мощности в США, спрос на чипы высок, а выручка в 2026 году может вырасти на 30%
24.03. МТС в Приморском крае организовал новый трансграничный переход интернет-трафика с China Mobile
24.03. Запущены первые 16 спутников БЮРО 1440
23.03. В России могут начать работы над литографом для техпроцесса 90 нм в 2026 году
23.03. Samsung Electronics вложит рекордные 110 трлн вон
23.03. МТС разместила биржевые облигации серии 002P-17 на 10 млрд
23.03. Билайн в Нижегородской области - покрытие 4G расширено в столице и в сельских населенных пунктах
23.03. Бельгийская imec получила в свое распоряжение ASML High NA EUV
25.03. OnePlus 15T – компактный флагман с батареей 7500 мАч, защитой IP69K и экраном 165 Гц
25.03. Samsung Galaxy Z Fold8 – 200 МП, 8-дюймовый экран и батарея 5000 мАч
25.03. Первый тизер Tecno Spark 50 5G раскрывает дизайн новинки
24.03. Huawei Enjoy 90 Plus и Enjoy 90 – Kirin 8000, батареи 6620 мАч и доступные цены
24.03. Huawei Enjoy 90 Pro Max – Kirin 8000, батарея 8500 мАч и экран 120 Гц за 250 долларов
23.03. Redmi 15A 5G – 6300 мАч и 120 Гц за «реальные деньги»
23.03. Xiaomi 17T и 17T Pro засветились в IMDA
20.03. Lenovo представила компактный Y700 с двумя USB-C и большие Xiaoxin Pro
20.03. iQOO Z11 с батареей 9020 мАч и экраном 165 Гц представят 26 марта
19.03. Ulefone RugKing 5 Pro – 20 000 мАч, 1202 светодиода и ночное видение за 270 долларов
19.03. Oppo A6s 5G – 80-ваттная зарядка и IP69 за 18 999 рупий
19.03. FOSSiBOT F116 Pro – компактный защищенный смартфон с креплением для экшн-камеры
18.03. Samsung Galaxy M17e 5G – ребрендинг A07 с батареей 6000 мАч за 140 долларов
18.03. Oppo Watch X3 – титан, сапфир и мониторинг глюкозы
18.03. Oppo Find N6 появился на глобальном рынке
17.03. Представлен Vivo Y51 Pro 5G с батареей 7200 мАч и защитой IP69
17.03. iQOO Z11x 5G – батарея 7200 мАч и мощный чип за 205 долларов
17.03. Realme C100 5G с экраном 144 Гц и АКБ 7000 мАч засветился у европейского ритейлера
16.03. Представлен Lava Bold 2 5G с плоским экраном, чистым Android и демократичной ценой
16.03. Раскрыты характеристики Oppo Pad 5 Pro – мощный планшет с батареей 13 000 мАч