<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>NVIDIA on CRGAS - 經濟與生活智慧</title><link>https://crgas.com.hk/tags/nvidia/</link><description>Recent content in NVIDIA on CRGAS - 經濟與生活智慧</description><generator>Hugo -- gohugo.io</generator><language>zh-hk</language><lastBuildDate>Sun, 15 Mar 2026 10:00:00 +0800</lastBuildDate><atom:link href="https://crgas.com.hk/tags/nvidia/index.xml" rel="self" type="application/rss+xml"/><item><title>NVIDIA GTC 2026 前夕：Jensen Huang 策略轉向 CPU，AI 基建進入新階段</title><link>https://crgas.com.hk/blog/nvidia-gtc-2026-ai-cpu-strategy/</link><pubDate>Sun, 15 Mar 2026 10:00:00 +0800</pubDate><guid>https://crgas.com.hk/blog/nvidia-gtc-2026-ai-cpu-strategy/</guid><description>&lt;img src="https://crgas.com.hk/images/nvidia-gtc-2026.jpg" alt="Featured image of post NVIDIA GTC 2026 前夕：Jensen Huang 策略轉向 CPU，AI 基建進入新階段" />&lt;p>&lt;strong>NVIDIA GTC 2026 峰會於 3 月 16 至 19 日在聖荷西舉行，39,000 人出席、190 個國家參與。Jensen Huang 預計公布針對 Agentic AI 的新一代 CPU 架構，NVIDIA 戰略從純 GPU 算力轉向 CPU+GPU 混合推理，標誌 AI 基建進入新階段。&lt;/strong>&lt;/p>
&lt;hr>
&lt;h2 id="從-gpu-霸主到混合推理平台">從 GPU 霸主到混合推理平台
&lt;/h2>&lt;p>過去數年，NVIDIA 的市值飛升幾乎完全建立在 GPU 需求爆炸之上。H100、H200 系列顯示卡幾乎成為各大雲端供應商和科研機構的標準配置，GPU 算力的稀缺一度令整個 AI 產業的發展節奏受到制約。&lt;/p>
&lt;p>然而，隨著 AI 應用從訓練階段轉向部署與推理，市場的需求結構正在悄然改變。訓練大型語言模型需要的是極度密集的並行計算，GPU 的優勢無可取代；但當 AI Agent 需要在生產環境中持續運行、即時回應、處理複雜的多步邏輯任務時，純 GPU 架構的延遲瓶頸和能耗代價開始浮面。&lt;/p>
&lt;p>這正是 Jensen Huang 在 GTC 2026 前夕釋出的核心訊息：下一代 AI 工作負載需要的，是一個 CPU 與 GPU 深度協作的混合推理架構，而非單純堆疊 GPU 核心。&lt;/p>
&lt;hr>
&lt;h2 id="agentic-ai-帶來的算力需求轉變">Agentic AI 帶來的算力需求轉變
&lt;/h2>&lt;p>Agentic AI 指的是能夠自主規劃、工具調用、多步執行的 AI 系統，有別於傳統的單次問答型語言模型。這類系統在執行過程中需要頻繁進行邏輯判斷、記憶狀態管理和外部 API 調用，這些操作對低延遲的序列計算需求更高，而不是單純的大規模矩陣運算。&lt;/p>
&lt;p>現有的 GPU 架構在處理這類序列任務時效率有限，每一次推理調用都需要調度大量閒置算力，造成明顯的資源浪費。NVIDIA 的 CPU 轉向策略，本質上是針對這一結構性矛盾提出的系統層回應——以 ARM 架構或自家 Grace CPU 搭配 GPU，在同一晶片封裝內完成混合推理，同時壓低延遲和能耗。&lt;/p>
&lt;p>業界分析師普遍認為，這一轉向的時機選擇並非偶然。Google TPU、AMD MI300 系列以及 Intel Gaudi 近年持續蠶食雲端訓練市場的部分份額，迫使 NVIDIA 在保持 GPU 主導地位的同時，開闢推理端的新優勢。&lt;/p>
&lt;hr>
&lt;h2 id="260-億開源投資的戰略意圖">$260 億開源投資的戰略意圖
&lt;/h2>&lt;p>GTC 2026 另一個備受關注的議題，是 NVIDIA 計劃投入最多 260 億美元支持開源 AI 生態的部署計劃。這筆資金規模接近部分中型國家的年度科技預算，其規模之大令業界側目。&lt;/p>
&lt;p>從戰略角度分析，這並非純粹的慈善行為。開源生態的繁榮直接擴大了 NVIDIA 硬件的潛在市場：更多開源工具、框架和模型在 CUDA 生態上運行，就意味著更多算力需求最終落到 NVIDIA 的硬件上。這種以開源撬動生態鎖定的策略，與 Android 對移動端市場的佈局有一定的相似邏輯。&lt;/p>
&lt;p>同步推出的 NemoClaw 企業 AI Agent 開源平台，則更直接針對企業市場。NemoClaw 旨在提供一套標準化的 AI Agent 部署框架，讓企業能在 NVIDIA 基建上快速構建自主化業務流程。平台的開源定位降低了企業的入門門檻，而實際的算力消耗仍然依賴 NVIDIA 的硬件生態。&lt;/p>
&lt;hr>
&lt;h2 id="對香港科技業的實際影響">對香港科技業的實際影響
&lt;/h2>&lt;p>從香港本地科技業的視角看，GTC 2026 宣布的技術路線圖有幾個值得留意的落地含義。&lt;/p>
&lt;p>&lt;strong>雲端採購策略的重新評估&lt;/strong>：本地企業若正在規劃 AI 基建投資，純 GPU 租用方案的長期性價比將受到 CPU+GPU 混合架構的衝擊。未來 12 至 18 個月，主要雲端供應商更新算力產品線後，企業的採購決策視窗將重新打開。&lt;/p>
&lt;p>&lt;strong>Agentic AI 應用的本地落地&lt;/strong>：NemoClaw 等開源框架的出現，降低了本地中型企業自行部署 AI Agent 的技術門檻。對於金融、法律、物流等行業，自主化業務流程的可行性正在從概念階段走向實驗部署。&lt;/p>
&lt;p>&lt;strong>人才需求的結構性轉變&lt;/strong>：混合推理架構的普及要求工程師同時具備 GPU 優化和 CPU 調度的系統知識，這對本地 AI 工程人才的技能要求提出了新課題。現有以純深度學習為主的人才培訓體系，可能需要在課程設計上作出相應調整。&lt;/p>
&lt;hr>
&lt;h2 id="規模背後的市場訊號">規模背後的市場訊號
&lt;/h2>&lt;p>39,000 人實體出席的數字，在科技峰會中屬於相當可觀的規模。對比 2023 年 GTC 的約 11,000 名出席者，三年間出席規模增長超過三倍，側面反映了全球 AI 產業在這段時期的急速膨脹。&lt;/p>
&lt;p>190 個國家的參與分佈，也說明 AI 基建的關注度已不再局限於美國、中國和歐洲的科技重鎮，中東、東南亞乃至非洲的部分市場均派員關注。對於香港而言，作為亞太區的科技金融中心，如何在這一輪 AI 基建競賽中找到差異化的定位，是業界和政策層面共同面對的議題。&lt;/p>
&lt;p>GTC 2026 的正式公告將在 3 月 16 日 Jensen Huang 的主題演講後陸續落地，屆時的具體產品規格和定價策略，將為業界提供更清晰的判斷依據。但從目前已知的戰略方向看，NVIDIA 正在主動引導整個 AI 基建市場從「算力堆砌」轉向「架構優化」——這一轉變的速度和深度，將在未來兩至三年內深刻影響全球科技投資的走向。&lt;/p></description></item></channel></rss>