企業瘋 AI 導致算力預算集體超支,使市場目光從「模型訓練」轉向成本更敏感的「推理(Inference)階段」。AI 雲端算力獨角獸 CoreWeave 共同創辦人 Brandon McBee 指出,企業客戶在推理需求上並未縮手,反而更積極鎖定中高階 GPU 產能。對台灣投資人而言,這波算力架構升級與合約延長潮,預示著液冷供應鏈與中高階晶片生命週期將比預期更長,這正是台股 AI 板塊下一個核心推力。
模型路由延長晶片生命週期
市場曾擔憂 GPU 折舊速度過快,兩年內恐形同廢鐵,但「模型路由(Model Routing)」技術的發展徹底扭轉了這個估值邏輯。企業開始導入智慧分流,將簡單的查詢導向輕量化模型,只有高難度任務才調用 Frontier 旗艦模型。這種分層配置讓 Nvidia 舊款的 A100 與主流 H100 晶片依然極具市場價值,預期生命週期可大幅拉長至六到八年。這對算力營運商與二手晶片市場的資產保值是一大催化劑,也代表伺服器代工廠的既有產品線生命週期將比預期更具韌性。
液冷已成新算力中心標配
從 Hopper 架構跨入 Blackwell,再到下一代的 Vera Rubin(維拉·魯賓)架構,硬體部署形式正發生根本性變革。過去 Hopper 主要採用氣冷,而 CoreWeave 的 Blackwell 與新一代部署則全面走向「液冷主流化」,並以 72 顆 GPU 的整機櫃(NVL72)大底座形式進駐資料中心。這驗證了散熱產業鏈的結構性商機並非短期炒作,而是硬體功耗攀升後的物理必然。隨著 CoreWeave 陸續收到 Vera Rubin 的測試機櫃,台廠液冷關鍵零組件的滲透率與出貨能見度將在接下來幾季迎來實質增長。
合約延長凸顯算力溢價
大型 AI 實驗室對基礎設施的黏著度正在顯著加深。McBee 透露,客戶簽署的合約年限已從兩年前的三年,拉長到去年的四年,如今更是主動要求綁定五年期的「不可取消且保障價格(Take-or-pay)」合約,且規模不斷放大。這種長約趨勢大幅降低了算力服務商的再融資風險,也說明在 scaling laws(規模定律)持續生效下,業界對實體算力的「飢餓感」絲毫未減。值得注意的是,雖然微軟等巨頭積極推出客製化 ASIC 晶片,但 CoreWeave 平台上的主流需求仍高達 90% 以上定錨於 Nvidia 生態系。
實體通電營運才是硬實力
當前算力產業的最大瓶頸已非晶片供應,而是「通電的空殼資料中心(Powered Shell)」。從變壓器、備用電池、土地、再到合格水電工的養成,實體基礎設施的建置周期極長。這點出了一個被市場忽略的估值盲點:在紙面上「宣稱」簽下多少電力與合約,並不等於能立刻轉化為可計費的 GPU 營運時數。對於融資規模超過 210 億美元的 CoreWeave 而言,其核心護城河在於工程執行力與軟體調優能力(如 Goodput、MFU 指標)。對交易者來說,評估 AI 概念股時,應更關注具備實際出貨與落地營運能力的硬體龍頭。
接下來值得盯緊的訊號是:Blackwell 整機櫃液冷系統在各大雲端服務商(CSP)的實際通電與放量時程,這將是決定明年第一季 AI 板塊動能的風向球。
他在討論自研晶片與第三方晶片的競爭時,將輝達視為絕對的護城河標的。他指出,儘管市場盛行「非輝達陣營」或自研晶片(ASIC)的討論,但從第一線客戶的實際動作來看,不管是訓練還是推理,客戶簽署五年的長期巨額合約時,指名度最高、最信賴的依然是輝達的生態系(CUDA)與硬體架構。值得對照:雖然微軟近期發表了搭配 MAI Thinking 1 的 Maya 200 自研晶片,但他認為這很難在商業市場撼動輝達的壟斷優勢。
他藉由微軟最新發表的「MAI Thinking 1」推理模型與其自研晶片 Maya 200,來帶出科技巨頭嘗試降低對外部晶片依賴的策略。他對此採取客觀中立的觀察視角,認為微軟此舉是為自身特定應用進行優化,但並非代表市場會大舉轉向非輝達架構。這項策略的成效,值得對照未來大客戶是否會繞過雲端巨頭,直接向專業 AI 雲端服務商採購原生輝達算力。