Amazon 的「模型超市」策略,如何在模型大戰中脫穎而出?
2025 Re:Invent 大會重點解析:AWS 選擇不與 Google 和 OpenAI 正面硬剛模型算力,而是確立「模型超市」定位。從 Trainium 晶片到 Nova Act Agent,深度分析 AWS 如何用開放生態與 CP 值突圍
2025 年 12 月,在拉斯維加斯的 Amazon Re:Invent 大會上,AWS 宣布了四大戰略升級:自研Trainium 3 晶片性能翻倍、Nova 2 模型系列全面更新、首創開放訓練平台 Nova Forge、以及 90% 可靠性的 Agent 服務 Nova Act。
透過這四大支柱的佈局,AWS 其實向市場傳遞了一個更深層的戰略信號:它正在確立其作為「模型超市」(Model Supermarket)的獨特定位。不強推自家單一模型,而是提供最開放的選擇,做 AI 時代的「軍火商」而非「參戰者」。
本文將從這次大會中提到的算力、平台、Agent 創新,以及 AWS 獨特的「模型超市」策略,解析這家雲端霸主如何重新定義 AI 基礎設施的遊戲規則。
第一支柱:NVIDIA 深度綁定 + 自研 ASIC 晶片
ASIC vs GPU:互補而非對立
市場上常有一種誤解,認為 AWS 推自研晶片是要取代 NVIDIA。但投資人與 AWS 高層在採訪中明確指出,ASIC(專用晶片)和 GPU 其實並不是對立關係,而是一個動態互補。
GPU 擁有最強的通用性與生態支持,適合前沿模型的訓練與廣泛的探索性任務。而 ASIC(如 TPU 或 Trainium)則針對特定模型的推理與訓練進行了極致優化,提供更具競爭力的成本結構。
AWS 的策略是「雙軌並行」:
- 提供最好的 GPU:繼續與 NVIDIA 深度綁定,確保擁有最可靠的 GPU 基礎設施。
- 歡迎來到 ASIC:對於特定特徵的工作負載,AWS 提供 Trainium 晶片作為更高效、性價比更高的選擇。
GPU 實力證明:OpenAI 與 Adobe
AWS 在 GPU 集群上的實力毋庸置疑。OpenAI 在 2025 年 11 月宣布與 AWS 達成 380 億美元的戰略合作,選用的正是搭載 NVIDIA GPU 的 Amazon EC2 Ultra Server 計算集群,以實現極低延遲的通信與高效運行。
另一個例子是 Adobe。Adobe Firefly 已經生成了超過 290 億份的創意資產,這些模型背後的訓練算力,正是由 NVIDIA GPU 驅動的 Amazon EC2 P5 和 P6 實例提供支持。
Trainium 的爆發性成長
與此同時,自研晶片 Trainium 的採用率也在飆升。AWS CEO Matt Garman 透露,在 Amazon Bedrock(AWS 的生成式 AI 全託管服務平台) 上,絕大部分的用戶推理任務已經轉向Trainium晶片。
其中最重量級的用戶就是 Anthropic。其旗艦模型的推理任務,大量運行在 Trainium 晶片上,這證明了 AWS 自研晶片已具備承載最頂尖大模型的能力。
新發布的數據更是亮眼:
- Trainium 3:採用 3nm 製程,能效提升 40%,算力翻倍。
- Trainium 4(預告):FP4 性能提升 6 倍,內存頻寬提升 4 倍。
這顯示了 AWS 在自研晶片上的決心:不僅要做 NVIDIA 的最佳隊友,也要成為企業控制成本的最佳替代方案。
第二與第三支柱:Nova 2自研模型與開放訓練平台
模型策略:不爭第一,爭「 CP值 」
很有意思的是,AWS 發布的 Nova 2系列模型(Lite, Pro, Sonic, Omni),並不試圖在所有指標上打敗 GPT 或 Gemini。
AWS 的邏輯是:在模型能力與競品持平的前提下,利用整個雲生態的配套(數據、安全、晶片),打出極致的 CP值。
Amazon Bedrock,AWS 的「AI軍火庫」
Amazon Bedrock 是這項全託管服務讓企業通過統一的 API,就能調用來自不同頂尖 AI 公司的基礎模型。企業不需要自己維護繁雜的伺服器,就能輕鬆切換使用 Claude、Llama 或 AWS 自家的 Nova 模型。
- Nova 2 Lite:面向日常工作負載,快速且經濟。
- Nova 2 Pro:處理高複雜度任務,適合Agent編程。
- Nova 2 Sonic:端到端語音模型,支持實時交互。
- Nova 2 Omni:全模態模型,同時處理圖文影音。
此外,AWS Bedrock 繼續引入外部強援,包括中國的 MiniMax、Kimi,以及 Google 的 Gemma和 NVIDIA 的 Nimochon,進一步強化其「匯聚大量模型」的平台屬性。
企業 AI 的三難困境與 Nova Forge 解法
企業在擁抱 AI 時,往往面臨「微調效果差」、「開源模型退化」、「自訓成本過高」的三難困境。
AWS 提出的解法是 Nova Forge 開放訓練平台。它允許企業將專有數據與 Nova 的模型架構深度融合,打造企業專屬的定製模型(Novalis)。Booking.com、Reddit 和 Sony都已開始利用 Nova Forge 構建契合自身需求的模型。
第四支柱:Nova Act 與 Agent Core 的最後一哩路
Policy in Agent Core:解決「敢不敢用」的問題
人工智慧代理(AI Agent)是 2026 年的發展重點,但企業遲遲不敢大規模部署,核心原因是「不可控」。
AWS 推出的 Amazon Bedrock Agent Core 試圖解決這「最後一哩」的問題,其核心功能包括:
- Policy(策略控制):企業可用自然語言定義 Agent 的邊界(例如「只能讀取不可寫入」、「只能訪問特定數據」),解決最棘手的權限問題。
- Evaluation(評估):內置工具監控 Agent 在實際運行中的準確性與幫助性。
- Memory(情景記憶):自動保存交互關鍵事件,讓 Agent 能從過往經驗中學習。
Nova Act:90% 的執行可靠性
針對瀏覽器自動化操作,AWS 發布了 Nova Act。在早期客戶(如 Solar Systems)的測試中,Nova Act 在導航、點擊、輸入等複雜工作流上達到了 90% 的執行可靠性。
這是一個巨大的飛躍。以往的 Agent 常常卡在網頁結構變更或彈窗干擾上,而 Nova Act 的高可靠性意味著企業終於可以放心地將「訂票」、「對賬」、「填表」等繁瑣工作交給 AI 自動完成。
戰略對比:AWS 的「模型超市」 vs Google 與 Microsoft 的垂直整合
Amazon Re:Invent 2025 最精彩的部分,莫過於 AWS 清晰地劃出了與 Google、Microsoft 截然不同的戰略邊界。
1. Google:極致的垂直整合 (Vertical Integration)
Google 的策略是自行垂直整合:TPU + Gemini模型 + Vertex AI + Search/Workspace入口。
- 優勢:優化極致,迭代速度快。
- 風險:深度綁定。如果企業選擇 Google Cloud,很大程度上就被鎖定在 Gemini 生態中。一旦 Gemini 在某個週期落後,企業將陷入被動。
2. Microsoft:OpenAI Centric 的雙頭馬車
Microsoft 的策略是 Azure + OpenAI。
- 優勢:擁有目前市場認知度最高的 GPT 系列模型,以及 Copilot 在 Office 軟體中的統治級入口。
- 風險:仰賴 OpenAI。雖然 Azure 也開始支援 Mistral 等模型,但其核心資源與優化無疑仍傾斜於 OpenAI。企業面臨著高昂的成本與供應商綁定風險。
3. AWS:中立的「模型超市」 (Model Supermarket)
AWS 的策略像極了它的電商本行:搭建一個中立、安全、物流通暢(算力強)的平台,讓所有供應商(模型)在上面賣貨。
- 策略:Bedrock 提供 Anthropic, Cohere, Meta, Mistral 以及自研 Nova,任君挑選。
- 優勢:
- 去風險化(De-risking):企業不會因單一模型商出現問題而停擺。
- 成本優化:企業可以針對不同任務「路由」到不同模型(簡單任務用便宜的 Nova Lite,複雜邏輯用強大的 Claude 4.5)。
- 監管安全:AWS 作為中立基礎設施,數據隱私邊界更清晰。它不拿你的數據去訓練一個要跟你競爭的超級模型。
Q: 為什麼企業選擇 AWS 而不是直接用 OpenAI 或 Google?
A: 對企業而言,模型是「零件」,不是「平台」。AWS 的策略是像電商一樣,提供完整的物流(基建)與安保(合規),讓企業在同一套安全標準下自由選擇商品(模型)。今天用 Claude,明天換 Llama,後天試試 Nova,無需重寫整個應用架構。這就是 AWS「模型超市」策略的核心吸引力。
AWS 的雲端戰略:卓越運營與全棧生態
回顧過去三年的 AI 發展:
- 第一年:巨大的新鮮感(Wow, 它可以寫詩!)。
- 第二年:巨大的失落感(哎,不太好用,Bug很多)。
- 第三年(現在):全力以赴的落地(Grounding)。
AWS CTO Werner Vogels在他的告別演講中強調了 「卓越運營」(Operational Excellence) 的專業自豪感。
他說:「我們建造的大部分東西,最終都不會有人看到。」
正是這些「看不見」的基建,穩定的電力、極低延遲的網絡、安全的數據圍欄、90% 可靠性的Agent,構成了 AWS 在 AI 長跑中的底氣。
Amazon Re:Invent 2025 說明,AWS 不打算在每一場模型跑分中都拿第一,但它打算成為所有 AI 應用跑得最穩、最便宜的跑道。
雖然 Amazon 在 2025 年的股價表現落後於其他科技巨頭,但「模型超市」策略或許從長期來看是一個更合理的選擇。就如同微軟 CEO Satya 說的,這些人工智慧模型最終可能會像是大宗商品一樣,而如果那一天來到,「模型超市」策略可能就會是最大贏家。
數據來源
- Amazon Re:Invent 2025 Keynote featuring CEO Matt Garman & CTO Werner Vogels
- OpenAI Strategic Partnership Announcement (Nov 2025)
- AWS Official Blog: Amazon Nova Models, Nova Forge, Bedrock Agent Core launch details
- Customer Stories: Adobe, Booking.com, Solar Systems, Blue Origin