主持人這次將台積電作為全球半導體製造核心的關鍵錨點帶出——強調不論是新創晶片架構還是傳統巨頭,都高度依賴其代工實力。論點聚焦於台積電是「地球上最強大的製造企業」,堪稱現代的金字塔。值得對照:雖然 Cerebras 巧妙繞過了台積電目前產能最吃緊的 3 奈米與 CoWoS 封裝,改用 5 奈米,但其晶圓級晶片的物理極限突破,仍必須與台積電進行深度技術協作才得以實現。
輝達在對話中被當作行業的「絕對既得利益者與標竿」來對比——其逐代加大晶片面積的歷史,證明了 Cerebras 走大晶片路線的正確性。然而,這次論點對輝達的軟體護城河提出挑戰,指出 Kuda 生態系在推理市場並無優勢,且三大前沿模型中已有兩款不依賴 Kuda,顯示其主導地位正出現「市場份額流失」的隱憂。值得對照:這提供了觀察輝達未來在推理市場防禦力的新視角。
亞馬遜是以「關鍵雲端基礎設施合作夥伴」的角色被引入。這次討論揭露了其 AWS 雲端服務將直接在 Bedrock 平台中整合新創晶片 CS-3 的合作模式。這顯示亞馬遜正透過引進非輝達陣營的極速推理方案,來滿足客戶對高階性能的需求並進行多策略押注,扮演了算力分發的關鍵通路角色。
這集主題在公開資訊中常被連結到的標的與後續觀察 · 由 AI 蒐集整理,非投資建議
AI 推理硬體架構典範轉移
隨著AI工作負載從訓練大規模轉向推論,通用GPU在高並發、低延遲的推理場景下面臨能效比與總持有成本劣勢,促使超大規模雲端服務商積極採用更具成本優勢的客製化ASIC與晶圓級專用架構。
- 3661世芯-KY作為高階AI ASIC設計服務的領先業者,深度參與亞馬遜新一代Trainium 3等專用AI晶片研發,直接受惠於晶片架構轉向專用ASIC的典範轉移。
- 2454聯發科與Google深度合作共同研發專注於推論的TPU v8x晶片,成功打入資料中心客製化ASIC市場並開啟全新成長引擎。
- CBRSCerebras Systems於2026年5月掛牌上市的晶圓級晶片黑馬,其WSE-3晶片採用全片上SRAM架構,擺脫了HBM和CoWoS瓶頸,在AI推論速度上取得顯著優勢。
- AVGO博通掌握全球主要的CSP自研AI ASIC設計合作,為Google、Meta及OpenAI提供最關鍵的客製化ASIC與系統網通互連方案。
若輝達整合LPU架構的新一代GPU推論效能大幅超越預期,且其軟體生態護城河難以被ASIC克服,將使專用晶片架構的商用普及速度放緩。
- Google TPUv8與AWS Trainium 3等新世代推理ASIC於2026下半年的量產進度
- Cerebras上市後的最新季報與其和OpenAI百億美元算力合約之營收認列情形
- 各家超大型資料中心對客製化晶片與通用GPU的採購佔比變化
半導體先進封裝瓶頸與繞道策略
先進封裝CoWoS與高頻寬記憶體HBM因產能高度受限,使得透過3D WoW晶圓堆疊、片上高容量SRAM、或採用無矽中介層封裝(如英特爾EMIB與FOPLP)的技術繞道方案,成為晶片大廠降低成本與穩定供貨的戰略重心。
- 6770力積電轉型為3D AI Foundry並提供3D WoW晶圓堆疊技術,其12吋IPD平台於2026年Q2放量出貨,成功打入英特爾EMIB先進封裝鏈。
- 6531愛普*提供獨特的3D晶圓堆疊異質整合技術(WoW),將高頻寬記憶體直接堆疊於邏輯晶片上,是替代HBM與避開CoWoS封裝限制的高性價比方案。
- INTC英特爾推廣其EMIB先進封裝技術作為CoWoS的繞道替代方案,該技術不需大面積矽中介層,已獲得Google新一代TPU等大廠採用評估。
若台積電CoWoS在2026年的產能擴充速度高於預期且良率大幅提升,可能減弱客戶改採繞道或替代封裝技術的短期緊迫性。
- 力積電12吋IPD平台在第二季出貨給英特爾EMIB的實質營收貢獻進度
- 英特爾EMIB先進封裝於Google新一代TPU與蘋果/博通晶片之驗證時程
- 台積電下一代Feynman平台採用堆疊SRAM設計對SoIC先進封裝產能的帶動
開源模型與算力性價比競爭
開源模型如Llama 4與DeepSeek V4的效能已能持平甚至超越部分閉源頂級模型,且其原生多模態與大幅通縮的運算成本,促使企業預算從高昂閉源API轉向開源本地部署,帶動伺服器供應鏈重新洗牌。
- 2382廣達為Meta伺服器的核心代工廠,直接受惠於Meta為了發展與推廣開源AI模型而於2026年突破千億美元的資本支出與GB300伺服器拉貨潮。
- 6669緯穎深度卡位Meta及微軟等大客戶,在開源與高性價比推理伺服器整機與液冷散熱機櫃設計中擁有高度議價權。
- METAMeta Platforms開源AI模型的最大推手,透過Llama 4大舉降低企業應用門檻,並大舉投資資本支出與自研MTIA晶片,推動開源算力性價比革命。
- AMD超微其MI300與MI350系列GPU具備超高HBM容量,在執行大型開源模型推論時提供極高性價比,成為企業繞過輝達硬體壟斷的首選。
若閉源大廠成功在更具商業價值的「多步驟深度推理」與代理人(Agent)架構上,拉開與開源模型的絕對智力代差,性價比競爭可能退化為低端市場。
- Meta在2026年大增53%資本支出(估1090億美元)的各季度實際執行與拉貨進度
- DeepSeek V4與Llama 4在企業端側AI與本地部署應用的滲透率
- 各家二線AI GPU與自研推理晶片的每萬瓦Token生成成本指標
本區由 AI 蒐集公開資訊整理,可能有誤或過時,僅供研究參考,非投資建議。