阿法觀點

AI 軍備競賽下半場:從燒錢堆算力轉向極致 Token 效率,地緣政治與記憶體產能成為新生死瓶頸

發佈於 2026.05.22
資料來源 · 14 集 podcast、45 則網路來源
參考 Podcast
本期精選
看多信念

HBM 產能產生的「晶圓懲罰」效應,導致通用 DRAM 供給被嚴重擠壓,合約價單季近翻倍且全年產能售罄。

$924 · 入選於 5/22(未記錄入選價)
來源 · 14 集 podcast
觀察

首日掛牌表現亮眼,以 SRAM 避開 HBM 與 CoWoS 瓶頸,但營收高度集中於中東 G42 且面臨出口管制風險。

$243 · 入選於 5/22(未記錄入選價)
來源 · 14 集 podcast
觀察

8 吋晶圓利用率回升與美方新一波成熟製程禁令帶來轉單紅利,但需防範中系代工廠低價搶單稀釋利潤。

$142 · 入選於 5/22(未記錄入選價)
來源 · 14 集 podcast
看多信念

高端企業軟體具備深厚工作流與負流失率護城河,殺估值已過度,AI Agent 落地將重塑其定價空間。

$176 · 入選於 5/22(未記錄入選價)
來源 · 14 集 podcast

隨著美股兩大指標企業 SpaceX 與 Cerebras 連袂啟動大型 IPO 申報,全球資金正對科技巨頭的「高額資本支出」與「實質獲利能力」進行一場無情的重估。AI 軍備競賽已正式告別無腦堆砌 GPU 算力的上半場,進入追求「極致 Token 生產效率」與「一站式系統整合」的生存戰役。在此典範轉移之下,地緣政治對高頻寬記憶體(HBM)的管制,以及底層產能排擠引發的通用 DRAM 暴漲,正成為全球半導體最棘手的新供給瓶頸。

Token 效率成為生死奇點,AI 商業化進入電價化定價時代

過去兩年,市場盲目迷信於「參數規模越大、模型越聰明」的硬體暴力美學,然而科技巨頭為此大舉發債、自由現金流近乎乾涸的財務壓力,已將這場算力狂熱逼入臨界點。高盛預估 2030 年全球 AI Token 消耗量將暴增 24 倍,在資本支出不可能無上限擴張的前提下,極致降低每單位 Token 的生產成本成為唯一救贖。值得注意的是,NVIDIA 執行長黃仁勳在 2026 年提出的 Token 定價框架,已將計費模式依交互速度劃分為尖離峰式的「電力化定價」;而 DeepSeek V4 以壓縮稀疏技術將百萬 Token 成本砍至上一代一成,對閉源巨頭形成毀滅性價格打擊。AI 競賽的勝負,已不再取決於單一晶片跑得多快,而是誰能用最低的功耗與最精簡的模型架構,壓榨出最大量的 Token 生產效率。

晶圓級架構與庫達防線鬆動,避開產能地雷的技術突圍

新掛牌的晶片新星 Cerebras 憑藉比常規 GPU 大 58 倍的晶圓級引擎(Wafer-Scale Engine)震撼市場,其核心邏輯在於以物理體積優勢擊碎「記憶體牆」瓶頸。由於直接在矽片上塞滿極速靜態隨機存取記憶體(SRAM),Cerebras 不僅在推理速度上展現比 H100 快 15 倍的驚人成績,更在策略上完美避開了 HBM 爭奪、台積電 CoWoS 封裝、以及 3 奈米製程等三大全球產能地雷。此外,過去被視為輝達終極護城河的 CUDA(庫達)防線正在推理時代加速瓦解。數據顯示,全球三大前沿模型中,Google 的 Gemini 與 Anthropic 的 Claude 已完全不依賴庫達運作。當企業端客戶為防範機密外洩而悄悄將預算移向開源模型,這種「開源軟體 + 高速推理專用晶片」的組合,正在結構性地解構硬體巨頭的壟斷地位。

記憶體因晶圓懲罰集體暴漲,罷工威脅加劇地緣供給瓶頸

半導體產業的雙極化正體現在「高獲利軟硬體生態系」與「大宗商品化記憶體循環」的估值落差。然而,HBM 製造存在極高且無法迴避的「晶圓懲罰(Die Penalty)」—— 生產 1GB 的 HBM 需消耗相當於 3GB 的標準 DRAM 晶圓空間。當三星、SK 海力士與美光在 2026 年將產能極限傾斜至 HBM,導致通用 DRAM 與 NAND Flash 產能遭受嚴重擠壓,合約價在第一季隨之暴漲近倍。在此敏感時刻,三星半導體部門面臨罷工威脅,實際產量損失恐波及整體產能。由於三星在全球 DRAM 市占高達四成,罷工不單是勞資糾紛,更將對先進製程供需產生巨大的外生衝擊,進而拖累 NVIDIA 次世代 Vera Rubin 架構的出貨時間表,這使記憶體在美中地緣摩擦之外,成為全球 AI 供應鏈最脆弱的實體瓶頸。

大國博弈退守東南亞中轉,成熟製程管制為台廠築起新防線

美中地緣政治防線的拉鋸,正迫使半導體出口管制從先進製程向成熟製程全面延伸。美國在川習會後雖對部分非敏感商品降稅,但對科技封鎖毫不手軟,甚至要求設備商停止向華虹半導體等二線廠出貨,這對聯電、世界先進等成熟製程台廠而言是結構性的訂單保障。相對地,由於輝達特供版 H20 在中國遭到冷落,華為昇騰系列在中國 AI 晶片市占率已逆勢攀升至五成,迫使地緣防線退守至東南亞中轉站。中國企業大舉透過在新加坡、馬來西亞設立國際框架,進行算力境外託管、數據回傳。值得追蹤的是,近期美國檢方聯合東南亞政府對非法轉運進行實質調查,顯示灰色地帶正在快速收窄,台廠在非中供應鏈中的協同開發與系統級定價權優勢將更加穩固。

往期阿法觀點