訂閱
糾錯
加入自媒體

英偉達(dá)為什么要花200 億美元“拿下”Groq ?

芝能智芯出品

2025 年 12 月,英偉達(dá)200 億美元通過技術(shù)授權(quán)與核心人才并入的方式,實質(zhì)性“吞下”了推理芯片公司 Groq 的內(nèi)核資產(chǎn)。

從現(xiàn)在來看,英偉達(dá)做的不是一筆常規(guī)意義上的并購,圍繞推理時代主導(dǎo)權(quán)展開的戰(zhàn)略性防御戰(zhàn)。

當(dāng)推理市場首次在規(guī)模上超過訓(xùn)練,當(dāng)超大規(guī)模云廠商全面推進自研 ASIC,當(dāng)算法效率開始壓縮“算力”的邊際價值,英偉達(dá)思考如果 AI 推理不再天然依賴 GPU,那英偉達(dá)的溢價還成立嗎?Groq,恰恰站在這個問題最危險的位置上。

Part 1Groq 的真正價值

Groq的語言處理單元(LPU)是一種專為AI推理設(shè)計的革命性芯片架構(gòu),與傳統(tǒng)GPU從圖形處理演變而來不同,LPU從零開始針對大型語言模型(LLM)的實時推理優(yōu)化,實現(xiàn)了低延遲、高效率的突破。

核心基于四個第一性原理:

 軟件優(yōu)先設(shè)計,先構(gòu)建確定性編譯器再設(shè)計硬件,確保操作靜態(tài)調(diào)度、無需自定義內(nèi)核;

 可編程裝配線架構(gòu),像傳送帶一樣同步流動數(shù)據(jù)通過計算單元,避免GPU的中心輻射式瓶頸;

 確定性執(zhí)行,消除緩存、分支預(yù)測等變異因素,每指令時延固定,提供可預(yù)測的亞毫秒級響應(yīng);

 片上SRAM內(nèi)存,提供數(shù)百MB本地存儲和極高帶寬(遠(yuǎn)超GPU的片外HBM),數(shù)據(jù)本地化減少延遲并提升能效,結(jié)果是推理速度比GPU快10倍、功耗低10倍,尤其適合單用戶實時交互場景。

Groq專注推理專精,通過模塊化流水線線性擴展、無外部交換機,實現(xiàn)低成本、高確定性性能,2025年9月融資7.5億美元估值69億美元。

在過去兩年里,Groq 頻繁以“每秒 500+ Token”“毫秒級確定性延遲”刷屏技術(shù)社區(qū)。但如果剝離所有營銷語言,Groq 的性能優(yōu)勢其實高度單一,把模型權(quán)重放進了 SRAM,直接用大容量片上 SRAM 作為主存儲。

在大模型推理中,計算單元并不稀缺,真正稀缺的是權(quán)重被調(diào)入的速度和數(shù)據(jù)在芯片內(nèi)外移動的延遲和能耗。傳統(tǒng) GPU的瓶頸不在算力,而在 HBM 到 SM 的數(shù)據(jù)路徑上,HBM 本質(zhì)仍是 DRAM,訪問延遲在百納秒量級。

Groq 的激進之處在于用極其昂貴、極其低延遲的 SRAM,計算單元可以持續(xù)滿負(fù)載運轉(zhuǎn)。

 延遲:從百納秒降到單時鐘周期

 帶寬:等效片上帶寬數(shù)量級提升

 能耗:幾乎消除“搬數(shù)據(jù)”的能量浪費

確定性延遲、VLIW、復(fù)雜編譯器是為了服務(wù) SRAM 路線不得不付出的工程代價,如果沒有 SRAM 帶來的帶寬和延遲優(yōu)勢:確定性沒有商業(yè)意義、編譯器復(fù)雜度只會成為負(fù)擔(dān)和VLIW 不具備通用競爭力,Groq成為英偉達(dá)眼中的“危險變量”。

從財務(wù)角度看,這是一筆極不理性的交易,Groq 營收規(guī)模數(shù)億美元,商業(yè)化難度極高,芯片成本結(jié)構(gòu)長期不具備規(guī)模優(yōu)勢,英偉達(dá)當(dāng)然清楚這一切,這 200 億美元,買的是“排他性”。

Part 2真正的威脅來自誰?

如果 Groq 被一家初創(chuàng)公司持有,威脅有限; 但如果 Groq 被超大規(guī)模云服務(wù)商收購,性質(zhì)完全不同。

谷歌、亞馬遜、微軟具備三種 Groq 自己不具備的能力:無限級別的資本投入、數(shù)據(jù)中心級系統(tǒng)整合能力,用低價推理服務(wù)“反向打擊 GPU 租賃市場”的動機。

一旦 SRAM 推理路徑被整合進云基礎(chǔ)設(shè)施,并被大規(guī)模攤薄成本,英偉達(dá) GPU 在推理端的定價邏輯將遭遇根本性挑戰(zhàn),這是估值體系之爭。

英偉達(dá)今天的市值,建立在一個核心敘事之上,GPU 是 AI 的唯一通用基礎(chǔ)設(shè)施。如果推理可以繞過 GPU,用另一種更高效、更低延遲的路徑完成,那么英偉達(dá)必然被重估,損失也是數(shù)千億美元級別。

在這個背景下,200 億美元不是“溢價”,而是極低成本的估值保險。

最近達(dá)模型的發(fā)展,不斷證明通過架構(gòu)優(yōu)化、精度管理、稀疏計算,可以在更低配置硬件上,完成接近甚至超過主流模型的推理效果,當(dāng)“更聰明的模型”開始減少對 FLOPS 的依賴,硬件競爭變成了,能把每一次數(shù)據(jù)移動榨干。

Groq 團隊,尤其是來自 TPU 體系的核心人物,可以帶來以極致數(shù)據(jù)路徑為中心的設(shè)計哲學(xué)。

為什么是“授權(quán) + 人才”,而不是直接并購?答案很簡單:監(jiān)管與控制的最優(yōu)解。

完整并購會觸發(fā)反壟斷,純投資導(dǎo)致控制力不足,于是出現(xiàn)了 2025 年大廠最常見的方案,法律上獨立,技術(shù)上抽空,人才上收編,Groq 仍然存在,GroqCloud 仍然運營,真正能推動下一代架構(gòu)演進的人,已經(jīng)被英偉達(dá)控制住了。

小結(jié)

英偉達(dá)買下的是“解釋權(quán)”,Groq 的技術(shù)本身,并不足以顛覆英偉達(dá),但 Groq 所代表的那條物理路徑,有這個潛力。英偉達(dá)只需要確保這條路不會成為“英偉達(dá)之外的標(biāo)準(zhǔn)”,不會被云廠商掌握,200 億美元,換來的正是這一切。

       原文標(biāo)題 : 英偉達(dá)為什么要花200 億美元“拿下”Groq ?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    智能制造 獵頭職位 更多
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號