NVIDIA GTC 2026 峰會於 3 月 16 至 19 日在聖荷西舉行,39,000 人出席、190 個國家參與。Jensen Huang 預計公布針對 Agentic AI 的新一代 CPU 架構,NVIDIA 戰略從純 GPU 算力轉向 CPU+GPU 混合推理,標誌 AI 基建進入新階段。
從 GPU 霸主到混合推理平台
過去數年,NVIDIA 的市值飛升幾乎完全建立在 GPU 需求爆炸之上。H100、H200 系列顯示卡幾乎成為各大雲端供應商和科研機構的標準配置,GPU 算力的稀缺一度令整個 AI 產業的發展節奏受到制約。
然而,隨著 AI 應用從訓練階段轉向部署與推理,市場的需求結構正在悄然改變。訓練大型語言模型需要的是極度密集的並行計算,GPU 的優勢無可取代;但當 AI Agent 需要在生產環境中持續運行、即時回應、處理複雜的多步邏輯任務時,純 GPU 架構的延遲瓶頸和能耗代價開始浮面。
這正是 Jensen Huang 在 GTC 2026 前夕釋出的核心訊息:下一代 AI 工作負載需要的,是一個 CPU 與 GPU 深度協作的混合推理架構,而非單純堆疊 GPU 核心。
Agentic AI 帶來的算力需求轉變
Agentic AI 指的是能夠自主規劃、工具調用、多步執行的 AI 系統,有別於傳統的單次問答型語言模型。這類系統在執行過程中需要頻繁進行邏輯判斷、記憶狀態管理和外部 API 調用,這些操作對低延遲的序列計算需求更高,而不是單純的大規模矩陣運算。
現有的 GPU 架構在處理這類序列任務時效率有限,每一次推理調用都需要調度大量閒置算力,造成明顯的資源浪費。NVIDIA 的 CPU 轉向策略,本質上是針對這一結構性矛盾提出的系統層回應——以 ARM 架構或自家 Grace CPU 搭配 GPU,在同一晶片封裝內完成混合推理,同時壓低延遲和能耗。
業界分析師普遍認為,這一轉向的時機選擇並非偶然。Google TPU、AMD MI300 系列以及 Intel Gaudi 近年持續蠶食雲端訓練市場的部分份額,迫使 NVIDIA 在保持 GPU 主導地位的同時,開闢推理端的新優勢。
$260 億開源投資的戰略意圖
GTC 2026 另一個備受關注的議題,是 NVIDIA 計劃投入最多 260 億美元支持開源 AI 生態的部署計劃。這筆資金規模接近部分中型國家的年度科技預算,其規模之大令業界側目。
從戰略角度分析,這並非純粹的慈善行為。開源生態的繁榮直接擴大了 NVIDIA 硬件的潛在市場:更多開源工具、框架和模型在 CUDA 生態上運行,就意味著更多算力需求最終落到 NVIDIA 的硬件上。這種以開源撬動生態鎖定的策略,與 Android 對移動端市場的佈局有一定的相似邏輯。
同步推出的 NemoClaw 企業 AI Agent 開源平台,則更直接針對企業市場。NemoClaw 旨在提供一套標準化的 AI Agent 部署框架,讓企業能在 NVIDIA 基建上快速構建自主化業務流程。平台的開源定位降低了企業的入門門檻,而實際的算力消耗仍然依賴 NVIDIA 的硬件生態。
對香港科技業的實際影響
從香港本地科技業的視角看,GTC 2026 宣布的技術路線圖有幾個值得留意的落地含義。
雲端採購策略的重新評估:本地企業若正在規劃 AI 基建投資,純 GPU 租用方案的長期性價比將受到 CPU+GPU 混合架構的衝擊。未來 12 至 18 個月,主要雲端供應商更新算力產品線後,企業的採購決策視窗將重新打開。
Agentic AI 應用的本地落地:NemoClaw 等開源框架的出現,降低了本地中型企業自行部署 AI Agent 的技術門檻。對於金融、法律、物流等行業,自主化業務流程的可行性正在從概念階段走向實驗部署。
人才需求的結構性轉變:混合推理架構的普及要求工程師同時具備 GPU 優化和 CPU 調度的系統知識,這對本地 AI 工程人才的技能要求提出了新課題。現有以純深度學習為主的人才培訓體系,可能需要在課程設計上作出相應調整。
規模背後的市場訊號
39,000 人實體出席的數字,在科技峰會中屬於相當可觀的規模。對比 2023 年 GTC 的約 11,000 名出席者,三年間出席規模增長超過三倍,側面反映了全球 AI 產業在這段時期的急速膨脹。
190 個國家的參與分佈,也說明 AI 基建的關注度已不再局限於美國、中國和歐洲的科技重鎮,中東、東南亞乃至非洲的部分市場均派員關注。對於香港而言,作為亞太區的科技金融中心,如何在這一輪 AI 基建競賽中找到差異化的定位,是業界和政策層面共同面對的議題。
GTC 2026 的正式公告將在 3 月 16 日 Jensen Huang 的主題演講後陸續落地,屆時的具體產品規格和定價策略,將為業界提供更清晰的判斷依據。但從目前已知的戰略方向看,NVIDIA 正在主動引導整個 AI 基建市場從「算力堆砌」轉向「架構優化」——這一轉變的速度和深度,將在未來兩至三年內深刻影響全球科技投資的走向。
