SemiAnalysis: Downstream Large Model Companies Are Already Highly Profitable; NVIDIA and Taiwan Semiconductor Can Earn Even More

華爾街見聞
2026.05.02 04:13

AI 價值鏈正在經歷結構性重估,芯片製造商面臨下游模型廠商的快速追趕。SemiAnalysis 分析指出,Anthropic 年化收入在數月內從 90 億美元升至逾 440 億美元,推理毛利率從 38% 增至 70% 以上。英偉達和台積電的定價框架尚未反映市場變化,預計將有 40% 以上的上調空間。AI 價值窪地正在轉移,基礎設施層的利潤將逐漸向模型層集中,預計 2025 年 AI 經濟邏輯將被重寫。

AI 價值鏈正在經歷結構性重估。過去賺走大部分利潤的芯片製造商正面臨下游模型廠商的快速追趕,但上游的利潤空間遠未觸及天花板。

SemiAnalysis 分析指出,Anthropic 年化收入在數月內從 90 億美元升至逾 440 億美元,推理毛利率從 38% 增至 70% 以上。英偉達目前的定價框架仍以成本為導向,尚未反映推理工作負載經濟學的變化。一旦框架調整,英偉達系統定價具備 40% 以上的上調空間。台積電 N3 製程產能同樣處於價值重分配的核心位置。

支撐此判斷的關鍵在於供需兩端的結構性錯配:N3 製程預計 2026 年下半年利用率將超過 100%,DRAM 工廠已逾 90% 滿負荷運行,而前沿模型的 Token 需求仍在以複合速度擴張。這一背景下,英偉達通過 SOCAMM 內存模塊實現差異化定價的窗口已經打開。

AI 價值窪地轉移:基礎設施層讓位於模型層

從 2023 年至 2025 年初,AI 價值鏈中的絕大部分利潤積聚於基礎設施層。英偉達率先爆發,隨後電力資產 Vistra 與 GE Vernova 分別在 2024 年上漲 265% 和 146%,存儲廠商 SanDisk、Western Digital、Seagate 和 Micron 在 2025 年均實現逾 200% 漲幅。

這一格局的背面,是模型創建者與推理服務商長期承受的低毛利困境。彼時 AI 的實際使用價值有限,市場對 AI 投資回報的質疑聲不斷。

轉折點出現在 2025 年 12 月。隨着 Agentic AI(智能體 AI)真正走向實用,AI 的經濟邏輯被徹底改寫。SemiAnalysis 披露,其自身年化 Token 消耗支出已接近員工薪酬的 30%,每名員工每月消耗 Token 量接近 50 億個,是 Meta 內部人均用量的 5 倍以上。大量原本需要初級分析師數小時完成的工作——包括財務建模、數據可視化、盈利分析——如今只需數美元的 Token 支出即可完成。

SemiAnalysis 估算,其團隊在 Anthropic Claude 上的年化支出峯值已達 1095 萬美元,而由此帶來的競爭優勢遠超這一成本。Anthropic 隨即受益:ARR 從 90 億美元飆升至 440 億美元以上,推理毛利率從 38% 升至超過 70%。

Token 成本驟降,模型廠商利潤率擴張具有持續性

驅動模型廠商毛利率躍升的另一核心因素,是 Token 生產成本的大幅下降。

從硬件維度看,在 8K 輸入、1K 輸出的標準推理任務上,經過完整軟件優化(含寬 EP、計算與預取分離、多令牌預測)的 B300 系統每秒每 GPU 可產生約 14000 個 Token,而未優化版本僅約 1000 個——同款硬件上,軟件優化單獨貢獻了 14 倍的吞吐量提升。若進一步疊加硬件升級,最優配置的 GB300 NVL72 相比 H100 的 FP8 吞吐量提升約 17 倍,切換至 H100 原生不支持的 FP4 精度後,差距擴大至 32 倍,而 GB300 每 GPU 總擁有成本僅高出約 70%。

從定價結構看,Agentic 工作負載具有極高的輸入輸出比(Claude Code 使用場景約為 300:1)與極高的緩存命中率(90% 以上),使得絕大多數 Token 落入最低計費檔。SemiAnalysis 估算,Opus 4.7 在智能體任務上的真實混合成本約為每百萬 Token0.99 美元,遠低於標價的每百萬輸入 Token5 美元。

即便面對 Anthropic 對 Opus 系列的大幅降價——Opus 4.5 的定價較此前降低三分之二——SemiAnalysis 認為 Anthropic 的單位毛利實際上有所提升:一方面,生產成本隨硬件升級進一步下降;另一方面,用户大規模從 Sonnet 切換至 Opus,推高了混合 ASP。

更具戰略意義的是,Anthropic 在高端產品線上仍擁有定價主導權。Opus Fast 定價為常規 Opus 的 6 倍,而已宣佈的 Mythos 定價為每百萬 Token25 美元/125 美元,是常規 Opus 的 5 倍。SemiAnalysis 明確表示,若 Anthropic 願意開放每百萬 Token150 美元/750 美元的 Mythos Fast,其團隊仍會購買——因為生產力提升的價值遠超成本。

模型廠商的定價權為何難以被競爭侵蝕

對於前沿模型高利潤率是否可持續,最常見的質疑來自競爭壓力。SemiAnalysis 給出了兩個反駁理由。

其一,前沿閉源模型與開源模型之間的能力差距依然顯著,且短期內難以彌合。以 Kimi K2.6(每百萬 Token0.95 美元/4 美元)為代表的低價開源模型對 Opus 定價幾乎不構成實質性壓制。

其二,算力約束意味着任何一家前沿實驗室都無法獨自服務整個市場。Anthropic 已通過將 Claude Code 鎖定在 100 美元以上月訂閲門檻、限制第三方接入等方式主動管理需求側。Token 需求在可預見的未來將持續超出供給,這意味着有能力提供真正前沿質量的實驗室,可以按照 Token 所創造的經濟價值而非競爭性成本來制定價格。

英偉達的定價剋制:監管邏輯還是戰略誤判

面對 AI 價值鏈的深刻重構,英偉達迄今未對其定價框架作出實質性調整,這是一個值得關注的結構性問題。

英偉達目前的定價仍主要以成本為錨,反映的是需求價值隨時間遞減的舊範式——而這一假設已不再成立。當前需求增長並非線性,而是以複合速度擴張,由智能體工作負載爆發與每個工作流程 Token 消耗量的持續躍升共同驅動。

SemiAnalysis 認為,英偉達保持定價剋制,部分原因在於監管層面的顧慮。英偉達在 GPU、互聯與軟件棧上的主導地位已引發日益密切的反壟斷關注。在下游 AI 實驗室同樣大幅盈利的背景下,激進提價可能加劇監管風險,也可能加速客户向 TPU、Trainium 等替代平台分散。

在此意義上,英偉達的行為模式與台積電頗為相似。台積電長期以來即便在滿負荷運營、扮演先進製程供應瓶頸的情況下,也未將定價提升至稀缺溢價的極限,而是優先維護生態系統長期穩定與客户關係。這一邏輯可概括為"AI 央行"——通過適度讓利支撐下游生態擴張,而非最大化短期利潤提取,以確保自身在 AI 時代的長期主導地位。

然而,這一策略存在真實的機會成本。在算力需求持續超過供給的結構性背景下,掌握稀缺資源卻未充分定價,相當於將價值拱手相讓給生態鏈中游和下游。台積電在 N3 製程上同樣如此——SemiAnalysis 直接指出這是"戰略失誤",至少應要求更大規模的預付款安排。

Rubin 定價空間:SOCAMM 成為利潤新槓桿

英偉達即將推出的 Vera Rubin VR NVL72 系統,提供了一個重新評估定價框架的契機。

從成本角度看,據測算,VR NVL72 實現與 GB300 NVL72 相同的 15.6% 項目 IRR(5 年期,15% 預付款)所需的最低 GPU 租金約為每小時 4.92 美元。從價值角度看,若以 FP8 密集算力維度錨定當前 GB300 每 PFLOP 租金約 0.70 美元,VR NVL72 對應的理論最高定價約為每 GPU 每小時 12.25 美元,是成本地板價的約 2.5 倍。

這一巨大價差表明,英偉達在 VR NVL72 定價上擁有充足的上調空間。SemiAnalysis 估算,若英偉達將系統定價提升約 40%,仍可為 Neocloud 保留足夠的利潤空間——即便 Neocloud 將租金提價至每小時 8 美元以上,對應每 PFLOP 成本仍低於歷史趨勢線。

在具體機制上,SOCAMM 成為最關鍵的定價槓桿。不同於 GB300 將 LPDDR5X 內存直接焊接於主板、嵌入整體系統定價,VR NVL72 採用可插拔的 SOCAMM 模塊,允許英偉達將內存作為獨立計費項目單獨列示和定價。

SOCAMM(Small Outline Compression Attached Memory Module,小型化壓縮附加內存模組)是英偉達主導、聯合三星、SK 海力士和美光等內存廠商開發的新型模塊化內存標準,基於 LPDDR5X(或未來 LPDDR6)DRAM 技術,面向 AI 服務器與個人 AI 超級計算機場景。

模型顯示,英偉達在 2026 年第一季度支付的 SOCAMM 合同價格約為每 GB 8 美元,較上季度大幅提升,主要反映 LPDDR5X 供應緊張與整體 DRAM 價格上行。基於對 2026 年底移動 DRAM 定價的預測,2026 年底 SOCAMM 定價或超過每 GB 13 美元,全年均值約 10 美元為合理假設。

在此基礎上,SemiAnalysis 認為英偉達在 SOCAMM 上收取 60% 毛利率具有合理性:一是內存供應全面緊張,英偉達在 SOCAMM 採購上具有優先獲取權;二是 VR NVL72 在性能/TCO 維度遠超同期競品,客户缺乏可替代選項;三是英偉達本身已面臨 SOCAMM 採購成本的大幅上漲,向下遊傳導具有合理依據。

此外,內存定價不像 GPU 定價那樣面臨反壟斷顧慮,這給了英偉達更大的差異化定價空間——包括對 Neocloud 與超大規模雲廠商實施差別定價。目前,英偉達在網絡設備上已對 Neocloud 收取約為超大規模雲廠商兩倍的價格,同樣的邏輯完全可以延伸至內存層面。

風險提示及免責條款

市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。