SemiAnalysis: Downstream Large Model Companies Are Already Highly Profitable; NVIDIA and Taiwan Semiconductor Can Earn Even More

AI 價值鏈正在經歷結構性重估，芯片製造商面臨下游模型廠商的快速追趕。SemiAnalysis 分析指出，Anthropic 年化收入在數月內從 90 億美元升至逾 440 億美元，推理毛利率從 38% 增至 70% 以上。英偉達和台積電的定價框架尚未反映市場變化，預計將有 40% 以上的上調空間。AI 價值窪地正在轉移，基礎設施層的利潤將逐漸向模型層集中，預計 2025 年 AI 經濟邏輯將被重寫。

AI 價值鏈正在經歷結構性重估。過去賺走大部分利潤的芯片製造商正面臨下游模型廠商的快速追趕，但上游的利潤空間遠未觸及天花板。

SemiAnalysis 分析指出，Anthropic 年化收入在數月內從 90 億美元升至逾 440 億美元，推理毛利率從 38% 增至 70% 以上。英偉達目前的定價框架仍以成本為導向，尚未反映推理工作負載經濟學的變化。一旦框架調整，英偉達系統定價具備 40% 以上的上調空間。台積電 N3 製程產能同樣處於價值重分配的核心位置。

支撐此判斷的關鍵在於供需兩端的結構性錯配：N3 製程預計 2026 年下半年利用率將超過 100%，DRAM 工廠已逾 90% 滿負荷運行，而前沿模型的 Token 需求仍在以複合速度擴張。這一背景下，英偉達通過 SOCAMM 內存模塊實現差異化定價的窗口已經打開。

AI 價值窪地轉移：基礎設施層讓位於模型層

從 2023 年至 2025 年初，AI 價值鏈中的絕大部分利潤積聚於基礎設施層。英偉達率先爆發，隨後電力資產 Vistra 與 GE Vernova 分別在 2024 年上漲 265% 和 146%，存儲廠商 SanDisk、Western Digital、Seagate 和 Micron 在 2025 年均實現逾 200% 漲幅。

這一格局的背面，是模型創建者與推理服務商長期承受的低毛利困境。彼時 AI 的實際使用價值有限，市場對 AI 投資回報的質疑聲不斷。

轉折點出現在 2025 年 12 月。隨着 Agentic AI（智能體 AI）真正走向實用，AI 的經濟邏輯被徹底改寫。SemiAnalysis 披露，其自身年化 Token 消耗支出已接近員工薪酬的 30%，每名員工每月消耗 Token 量接近 50 億個，是 Meta 內部人均用量的 5 倍以上。大量原本需要初級分析師數小時完成的工作——包括財務建模、數據可視化、盈利分析——如今只需數美元的 Token 支出即可完成。

SemiAnalysis 估算，其團隊在 Anthropic Claude 上的年化支出峯值已達 1095 萬美元，而由此帶來的競爭優勢遠超這一成本。Anthropic 隨即受益：ARR 從 90 億美元飆升至 440 億美元以上，推理毛利率從 38% 升至超過 70%。

Token 成本驟降，模型廠商利潤率擴張具有持續性

驅動模型廠商毛利率躍升的另一核心因素，是 Token 生產成本的大幅下降。

從硬件維度看，在 8K 輸入、1K 輸出的標準推理任務上，經過完整軟件優化（含寬 EP、計算與預取分離、多令牌預測）的 B300 系統每秒每 GPU 可產生約 14000 個 Token，而未優化版本僅約 1000 個——同款硬件上，軟件優化單獨貢獻了 14 倍的吞吐量提升。若進一步疊加硬件升級，最優配置的 GB300 NVL72 相比 H100 的 FP8 吞吐量提升約 17 倍，切換至 H100 原生不支持的 FP4 精度後，差距擴大至 32 倍，而 GB300 每 GPU 總擁有成本僅高出約 70%。

從定價結構看，Agentic 工作負載具有極高的輸入輸出比（Claude Code 使用場景約為 300:1）與極高的緩存命中率（90% 以上），使得絕大多數 Token 落入最低計費檔。SemiAnalysis 估算，Opus 4.7 在智能體任務上的真實混合成本約為每百萬 Token0.99 美元，遠低於標價的每百萬輸入 Token5 美元。

即便面對 Anthropic 對 Opus 系列的大幅降價——Opus 4.5 的定價較此前降低三分之二——SemiAnalysis 認為 Anthropic 的單位毛利實際上有所提升：一方面，生產成本隨硬件升級進一步下降；另一方面，用户大規模從 Sonnet 切換至 Opus，推高了混合 ASP。

更具戰略意義的是，Anthropic 在高端產品線上仍擁有定價主導權。Opus Fast 定價為常規 Opus 的 6 倍，而已宣佈的 Mythos 定價為每百萬 Token25 美元/125 美元，是常規 Opus 的 5 倍。SemiAnalysis 明確表示，若 Anthropic 願意開放每百萬 Token150 美元/750 美元的 Mythos Fast，其團隊仍會購買——因為生產力提升的價值遠超成本。

模型廠商的定價權為何難以被競爭侵蝕

對於前沿模型高利潤率是否可持續，最常見的質疑來自競爭壓力。SemiAnalysis 給出了兩個反駁理由。

其一，前沿閉源模型與開源模型之間的能力差距依然顯著，且短期內難以彌合。以 Kimi K2.6（每百萬 Token0.95 美元/4 美元）為代表的低價開源模型對 Opus 定價幾乎不構成實質性壓制。

其二，算力約束意味着任何一家前沿實驗室都無法獨自服務整個市場。Anthropic 已通過將 Claude Code 鎖定在 100 美元以上月訂閲門檻、限制第三方接入等方式主動管理需求側。Token 需求在可預見的未來將持續超出供給，這意味着有能力提供真正前沿質量的實驗室，可以按照 Token 所創造的經濟價值而非競爭性成本來制定價格。

英偉達的定價剋制：監管邏輯還是戰略誤判

面對 AI 價值鏈的深刻重構，英偉達迄今未對其定價框架作出實質性調整，這是一個值得關注的結構性問題。

英偉達目前的定價仍主要以成本為錨，反映的是需求價值隨時間遞減的舊範式——而這一假設已不再成立。當前需求增長並非線性，而是以複合速度擴張，由智能體工作負載爆發與每個工作流程 Token 消耗量的持續躍升共同驅動。

SemiAnalysis 認為，英偉達保持定價剋制，部分原因在於監管層面的顧慮。英偉達在 GPU、互聯與軟件棧上的主導地位已引發日益密切的反壟斷關注。在下游 AI 實驗室同樣大幅盈利的背景下，激進提價可能加劇監管風險，也可能加速客户向 TPU、Trainium 等替代平台分散。

在此意義上，英偉達的行為模式與台積電頗為相似。台積電長期以來即便在滿負荷運營、扮演先進製程供應瓶頸的情況下，也未將定價提升至稀缺溢價的極限，而是優先維護生態系統長期穩定與客户關係。這一邏輯可概括為"AI 央行"——通過適度讓利支撐下游生態擴張，而非最大化短期利潤提取，以確保自身在 AI 時代的長期主導地位。

然而，這一策略存在真實的機會成本。在算力需求持續超過供給的結構性背景下，掌握稀缺資源卻未充分定價，相當於將價值拱手相讓給生態鏈中游和下游。台積電在 N3 製程上同樣如此——SemiAnalysis 直接指出這是"戰略失誤"，至少應要求更大規模的預付款安排。

Rubin 定價空間：SOCAMM 成為利潤新槓桿

英偉達即將推出的 Vera Rubin VR NVL72 系統，提供了一個重新評估定價框架的契機。

從成本角度看，據測算，VR NVL72 實現與 GB300 NVL72 相同的 15.6% 項目 IRR（5 年期，15% 預付款）所需的最低 GPU 租金約為每小時 4.92 美元。從價值角度看，若以 FP8 密集算力維度錨定當前 GB300 每 PFLOP 租金約 0.70 美元，VR NVL72 對應的理論最高定價約為每 GPU 每小時 12.25 美元，是成本地板價的約 2.5 倍。

這一巨大價差表明，英偉達在 VR NVL72 定價上擁有充足的上調空間。SemiAnalysis 估算，若英偉達將系統定價提升約 40%，仍可為 Neocloud 保留足夠的利潤空間——即便 Neocloud 將租金提價至每小時 8 美元以上，對應每 PFLOP 成本仍低於歷史趨勢線。

在具體機制上，SOCAMM 成為最關鍵的定價槓桿。不同於 GB300 將 LPDDR5X 內存直接焊接於主板、嵌入整體系統定價，VR NVL72 採用可插拔的 SOCAMM 模塊，允許英偉達將內存作為獨立計費項目單獨列示和定價。

SOCAMM（Small Outline Compression Attached Memory Module，小型化壓縮附加內存模組）是英偉達主導、聯合三星、SK 海力士和美光等內存廠商開發的新型模塊化內存標準，基於 LPDDR5X（或未來 LPDDR6）DRAM 技術，面向 AI 服務器與個人 AI 超級計算機場景。

模型顯示，英偉達在 2026 年第一季度支付的 SOCAMM 合同價格約為每 GB 8 美元，較上季度大幅提升，主要反映 LPDDR5X 供應緊張與整體 DRAM 價格上行。基於對 2026 年底移動 DRAM 定價的預測，2026 年底 SOCAMM 定價或超過每 GB 13 美元，全年均值約 10 美元為合理假設。

在此基礎上，SemiAnalysis 認為英偉達在 SOCAMM 上收取 60% 毛利率具有合理性：一是內存供應全面緊張，英偉達在 SOCAMM 採購上具有優先獲取權；二是 VR NVL72 在性能/TCO 維度遠超同期競品，客户缺乏可替代選項；三是英偉達本身已面臨 SOCAMM 採購成本的大幅上漲，向下遊傳導具有合理依據。

此外，內存定價不像 GPU 定價那樣面臨反壟斷顧慮，這給了英偉達更大的差異化定價空間——包括對 Neocloud 與超大規模雲廠商實施差別定價。目前，英偉達在網絡設備上已對 Neocloud 收取約為超大規模雲廠商兩倍的價格，同樣的邏輯完全可以延伸至內存層面。

風險提示及免責條款

市場有風險，投資需謹慎。本文不構成個人投資建議，也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資，責任自負。