Amazon 的「模型超市」策略,如何在模型大戰中脫穎而出?

2025 Re:Invent 大會重點解析:AWS 選擇不與 Google 和 OpenAI 正面硬剛模型算力,而是確立「模型超市」定位。從 Trainium 晶片到 Nova Act Agent,深度分析 AWS 如何用開放生態與 CP 值突圍

Amazon 的「模型超市」策略,如何在模型大戰中脫穎而出?
AWS 向市場傳遞信號:它正朝向「模型超市」(Model Supermarket)前進

2025 年 12 月,在拉斯維加斯的 Amazon Re:Invent 大會上,AWS 宣布了四大戰略升級:自研Trainium 3 晶片性能翻倍、Nova 2 模型系列全面更新、首創開放訓練平台 Nova Forge、以及 90% 可靠性的 Agent 服務 Nova Act。

透過這四大支柱的佈局,AWS 其實向市場傳遞了一個更深層的戰略信號:它正在確立其作為「模型超市」(Model Supermarket)的獨特定位。不強推自家單一模型,而是提供最開放的選擇,做 AI 時代的「軍火商」而非「參戰者」。

本文將從這次大會中提到的算力、平台、Agent 創新,以及 AWS 獨特的「模型超市」策略,解析這家雲端霸主如何重新定義 AI 基礎設施的遊戲規則。


第一支柱:NVIDIA 深度綁定 + 自研 ASIC 晶片

ASIC vs GPU:互補而非對立

市場上常有一種誤解,認為 AWS 推自研晶片是要取代 NVIDIA。但投資人與 AWS 高層在採訪中明確指出,ASIC(專用晶片)和 GPU 其實並不是對立關係,而是一個動態互補

GPU 擁有最強的通用性與生態支持,適合前沿模型的訓練與廣泛的探索性任務。而 ASIC(如 TPU 或 Trainium)則針對特定模型的推理與訓練進行了極致優化,提供更具競爭力的成本結構。

AWS 的策略是「雙軌並行」:

  1. 提供最好的 GPU:繼續與 NVIDIA 深度綁定,確保擁有最可靠的 GPU 基礎設施。
  2. 歡迎來到 ASIC:對於特定特徵的工作負載,AWS 提供 Trainium 晶片作為更高效、性價比更高的選擇。

GPU 實力證明:OpenAI 與 Adobe

AWS 在 GPU 集群上的實力毋庸置疑。OpenAI 在 2025 年 11 月宣布與 AWS 達成 380 億美元的戰略合作,選用的正是搭載 NVIDIA GPU 的 Amazon EC2 Ultra Server 計算集群,以實現極低延遲的通信與高效運行。

另一個例子是 Adobe。Adobe Firefly 已經生成了超過 290 億份的創意資產,這些模型背後的訓練算力,正是由 NVIDIA GPU 驅動的 Amazon EC2 P5 和 P6 實例提供支持。

Trainium 的爆發性成長

與此同時,自研晶片 Trainium 的採用率也在飆升。AWS CEO Matt Garman 透露,在 Amazon Bedrock(AWS 的生成式 AI 全託管服務平台) 上,絕大部分的用戶推理任務已經轉向Trainium晶片。

其中最重量級的用戶就是 Anthropic。其旗艦模型的推理任務,大量運行在 Trainium 晶片上,這證明了 AWS 自研晶片已具備承載最頂尖大模型的能力。

新發布的數據更是亮眼:

  • Trainium 3:採用 3nm 製程,能效提升 40%,算力翻倍。
  • Trainium 4(預告):FP4 性能提升 6 倍,內存頻寬提升 4 倍。

這顯示了 AWS 在自研晶片上的決心:不僅要做 NVIDIA 的最佳隊友,也要成為企業控制成本的最佳替代方案。


第二與第三支柱:Nova 2自研模型與開放訓練平台

模型策略:不爭第一,爭「 CP值 」

很有意思的是,AWS 發布的 Nova 2系列模型(Lite, Pro, Sonic, Omni),並不試圖在所有指標上打敗 GPT 或 Gemini。

AWS 的邏輯是:在模型能力與競品持平的前提下,利用整個雲生態的配套(數據、安全、晶片),打出極致的 CP值

Amazon Bedrock,AWS 的「AI軍火庫」
Amazon Bedrock 是這項全託管服務讓企業通過統一的 API,就能調用來自不同頂尖 AI 公司的基礎模型。企業不需要自己維護繁雜的伺服器,就能輕鬆切換使用 Claude、Llama 或 AWS 自家的 Nova 模型。

  • Nova 2 Lite:面向日常工作負載,快速且經濟。
  • Nova 2 Pro:處理高複雜度任務,適合Agent編程。
  • Nova 2 Sonic:端到端語音模型,支持實時交互。
  • Nova 2 Omni:全模態模型,同時處理圖文影音。

此外,AWS Bedrock 繼續引入外部強援,包括中國的 MiniMax、Kimi,以及 Google 的 Gemma和 NVIDIA 的 Nimochon,進一步強化其「匯聚大量模型」的平台屬性。

企業 AI 的三難困境與 Nova Forge 解法

企業在擁抱 AI 時,往往面臨「微調效果差」、「開源模型退化」、「自訓成本過高」的三難困境。

AWS 提出的解法是 Nova Forge 開放訓練平台。它允許企業將專有數據與 Nova 的模型架構深度融合,打造企業專屬的定製模型(Novalis)。Booking.com、Reddit 和 Sony都已開始利用 Nova Forge 構建契合自身需求的模型。


第四支柱:Nova Act 與 Agent Core 的最後一哩路

Policy in Agent Core:解決「敢不敢用」的問題

人工智慧代理(AI Agent)是 2026 年的發展重點,但企業遲遲不敢大規模部署,核心原因是「不可控」。

AWS 推出的 Amazon Bedrock Agent Core 試圖解決這「最後一哩」的問題,其核心功能包括:

  1. Policy(策略控制):企業可用自然語言定義 Agent 的邊界(例如「只能讀取不可寫入」、「只能訪問特定數據」),解決最棘手的權限問題。
  2. Evaluation(評估):內置工具監控 Agent 在實際運行中的準確性與幫助性。
  3. Memory(情景記憶):自動保存交互關鍵事件,讓 Agent 能從過往經驗中學習。

Nova Act:90% 的執行可靠性

針對瀏覽器自動化操作,AWS 發布了 Nova Act。在早期客戶(如 Solar Systems)的測試中,Nova Act 在導航、點擊、輸入等複雜工作流上達到了 90% 的執行可靠性

這是一個巨大的飛躍。以往的 Agent 常常卡在網頁結構變更或彈窗干擾上,而 Nova Act 的高可靠性意味著企業終於可以放心地將「訂票」、「對賬」、「填表」等繁瑣工作交給 AI 自動完成。


戰略對比:AWS 的「模型超市」 vs Google 與 Microsoft 的垂直整合

Amazon Re:Invent 2025 最精彩的部分,莫過於 AWS 清晰地劃出了與 Google、Microsoft 截然不同的戰略邊界。

1. Google:極致的垂直整合 (Vertical Integration)

Google 的策略是自行垂直整合:TPU + Gemini模型 + Vertex AI + Search/Workspace入口

  • 優勢:優化極致,迭代速度快。
  • 風險:深度綁定。如果企業選擇 Google Cloud,很大程度上就被鎖定在 Gemini 生態中。一旦 Gemini 在某個週期落後,企業將陷入被動。

2. Microsoft:OpenAI Centric 的雙頭馬車

Microsoft 的策略是 Azure + OpenAI

  • 優勢:擁有目前市場認知度最高的 GPT 系列模型,以及 Copilot 在 Office 軟體中的統治級入口。
  • 風險:仰賴 OpenAI。雖然 Azure 也開始支援 Mistral 等模型,但其核心資源與優化無疑仍傾斜於 OpenAI。企業面臨著高昂的成本與供應商綁定風險。

3. AWS:中立的「模型超市」 (Model Supermarket)

AWS 的策略像極了它的電商本行:搭建一個中立、安全、物流通暢(算力強)的平台,讓所有供應商(模型)在上面賣貨

  • 策略:Bedrock 提供 Anthropic, Cohere, Meta, Mistral 以及自研 Nova,任君挑選。
  • 優勢
    1. 去風險化(De-risking):企業不會因單一模型商出現問題而停擺。
    2. 成本優化:企業可以針對不同任務「路由」到不同模型(簡單任務用便宜的 Nova Lite,複雜邏輯用強大的 Claude 4.5)。
    3. 監管安全:AWS 作為中立基礎設施,數據隱私邊界更清晰。它不拿你的數據去訓練一個要跟你競爭的超級模型。

Q: 為什麼企業選擇 AWS 而不是直接用 OpenAI 或 Google?

A: 對企業而言,模型是「零件」,不是「平台」。AWS 的策略是像電商一樣,提供完整的物流(基建)與安保(合規),讓企業在同一套安全標準下自由選擇商品(模型)。今天用 Claude,明天換 Llama,後天試試 Nova,無需重寫整個應用架構。這就是 AWS「模型超市」策略的核心吸引力。


AWS 的雲端戰略:卓越運營與全棧生態

回顧過去三年的 AI 發展:

  • 第一年:巨大的新鮮感(Wow, 它可以寫詩!)。
  • 第二年:巨大的失落感(哎,不太好用,Bug很多)。
  • 第三年(現在):全力以赴的落地(Grounding)

AWS CTO Werner Vogels在他的告別演講中強調了 「卓越運營」(Operational Excellence) 的專業自豪感。

他說:「我們建造的大部分東西,最終都不會有人看到。」

正是這些「看不見」的基建,穩定的電力、極低延遲的網絡、安全的數據圍欄、90% 可靠性的Agent,構成了 AWS 在 AI 長跑中的底氣。

Amazon Re:Invent 2025 說明,AWS 不打算在每一場模型跑分中都拿第一,但它打算成為所有 AI 應用跑得最穩、最便宜的跑道。

雖然 Amazon 在 2025 年的股價表現落後於其他科技巨頭,但「模型超市」策略或許從長期來看是一個更合理的選擇。就如同微軟 CEO Satya 說的,這些人工智慧模型最終可能會像是大宗商品一樣,而如果那一天來到,「模型超市」策略可能就會是最大贏家。


數據來源

  • Amazon Re:Invent 2025 Keynote featuring CEO Matt Garman & CTO Werner Vogels
  • OpenAI Strategic Partnership Announcement (Nov 2025)
  • AWS Official Blog: Amazon Nova Models, Nova Forge, Bedrock Agent Core launch details
  • Customer Stories: Adobe, Booking.com, Solar Systems, Blue Origin

Read more