NVIDIA GTC 2026 前夕：Jensen Huang 策略轉向 CPU，AI 基建進入新階段

Sun, 15 Mar 2026 10:00:00 +0800

NVIDIA GTC 2026 峰會於 3 月 16 至 19 日在聖荷西舉行，39,000 人出席、190 個國家參與。Jensen Huang 預計公布針對 Agentic AI 的新一代 CPU 架構，NVIDIA 戰略從純 GPU 算力轉向 CPU+GPU 混合推理，標誌 AI 基建進入新階段。

從 GPU 霸主到混合推理平台

過去數年，NVIDIA 的市值飛升幾乎完全建立在 GPU 需求爆炸之上。H100、H200 系列顯示卡幾乎成為各大雲端供應商和科研機構的標準配置，GPU 算力的稀缺一度令整個 AI 產業的發展節奏受到制約。

然而，隨著 AI 應用從訓練階段轉向部署與推理，市場的需求結構正在悄然改變。訓練大型語言模型需要的是極度密集的並行計算，GPU 的優勢無可取代；但當 AI Agent 需要在生產環境中持續運行、即時回應、處理複雜的多步邏輯任務時，純 GPU 架構的延遲瓶頸和能耗代價開始浮面。

這正是 Jensen Huang 在 GTC 2026 前夕釋出的核心訊息：下一代 AI 工作負載需要的，是一個 CPU 與 GPU 深度協作的混合推理架構，而非單純堆疊 GPU 核心。

Agentic AI 帶來的算力需求轉變

Agentic AI 指的是能夠自主規劃、工具調用、多步執行的 AI 系統，有別於傳統的單次問答型語言模型。這類系統在執行過程中需要頻繁進行邏輯判斷、記憶狀態管理和外部 API 調用，這些操作對低延遲的序列計算需求更高，而不是單純的大規模矩陣運算。

現有的 GPU 架構在處理這類序列任務時效率有限，每一次推理調用都需要調度大量閒置算力，造成明顯的資源浪費。NVIDIA 的 CPU 轉向策略，本質上是針對這一結構性矛盾提出的系統層回應——以 ARM 架構或自家 Grace CPU 搭配 GPU，在同一晶片封裝內完成混合推理，同時壓低延遲和能耗。

業界分析師普遍認為，這一轉向的時機選擇並非偶然。Google TPU、AMD MI300 系列以及 Intel Gaudi 近年持續蠶食雲端訓練市場的部分份額，迫使 NVIDIA 在保持 GPU 主導地位的同時，開闢推理端的新優勢。

$260 億開源投資的戰略意圖

GTC 2026 另一個備受關注的議題，是 NVIDIA 計劃投入最多 260 億美元支持開源 AI 生態的部署計劃。這筆資金規模接近部分中型國家的年度科技預算，其規模之大令業界側目。

從戰略角度分析，這並非純粹的慈善行為。開源生態的繁榮直接擴大了 NVIDIA 硬件的潛在市場：更多開源工具、框架和模型在 CUDA 生態上運行，就意味著更多算力需求最終落到 NVIDIA 的硬件上。這種以開源撬動生態鎖定的策略，與 Android 對移動端市場的佈局有一定的相似邏輯。

同步推出的 NemoClaw 企業 AI Agent 開源平台，則更直接針對企業市場。NemoClaw 旨在提供一套標準化的 AI Agent 部署框架，讓企業能在 NVIDIA 基建上快速構建自主化業務流程。平台的開源定位降低了企業的入門門檻，而實際的算力消耗仍然依賴 NVIDIA 的硬件生態。

對香港科技業的實際影響

從香港本地科技業的視角看，GTC 2026 宣布的技術路線圖有幾個值得留意的落地含義。

雲端採購策略的重新評估：本地企業若正在規劃 AI 基建投資，純 GPU 租用方案的長期性價比將受到 CPU+GPU 混合架構的衝擊。未來 12 至 18 個月，主要雲端供應商更新算力產品線後，企業的採購決策視窗將重新打開。

Agentic AI 應用的本地落地：NemoClaw 等開源框架的出現，降低了本地中型企業自行部署 AI Agent 的技術門檻。對於金融、法律、物流等行業，自主化業務流程的可行性正在從概念階段走向實驗部署。

人才需求的結構性轉變：混合推理架構的普及要求工程師同時具備 GPU 優化和 CPU 調度的系統知識，這對本地 AI 工程人才的技能要求提出了新課題。現有以純深度學習為主的人才培訓體系，可能需要在課程設計上作出相應調整。

規模背後的市場訊號

39,000 人實體出席的數字，在科技峰會中屬於相當可觀的規模。對比 2023 年 GTC 的約 11,000 名出席者，三年間出席規模增長超過三倍，側面反映了全球 AI 產業在這段時期的急速膨脹。

190 個國家的參與分佈，也說明 AI 基建的關注度已不再局限於美國、中國和歐洲的科技重鎮，中東、東南亞乃至非洲的部分市場均派員關注。對於香港而言，作為亞太區的科技金融中心，如何在這一輪 AI 基建競賽中找到差異化的定位，是業界和政策層面共同面對的議題。