你手上的 iPhone 或 Android 手機,裡面的 AI 助理為什麼有時聰明得像個天才,有時卻笨得像塊木頭?答案不是軟體寫得不好,而是你正在使用的 AI 模型,背後運算的晶片,很可能根本不是為「你」設計的。
當你以為 AI 的軍備競賽只存在於 OpenAI 和 Google 之間時,真正的戰場早已悄悄轉移——從地表最強的輝達 GPU,到 Google 自己養了多年的「神祕武器」TPU,再到那個讓所有人跌破眼鏡的 AI 新創 Anthropic。Google Cloud CEO Thomas Kurian 在 2026 年 4 月底的一場深度訪談中,把這一切全都攤在陽光下。
這不是一場普通的產品發表會。這是一場關於 AI 未來五年基礎設施的「權力遊戲」。如果你以為 AI 只是聊天機器人,那你可能錯過了整個時代。今天,我們將從這場訪談中,挖出 7 個讓你下巴掉下來的核心要點——關於晶片、關於競爭、關於那個你絕對想不到的「神話」級 AI 模型。
1. 輝達不是唯一的答案,Google TPU 才是那個「隱形冠軍」
當全世界都在瘋搶輝達 H100 和 B200 時,Google Cloud 的 CEO 卻直接潑了一盆冷水:「輝達很棒,但我們有更好的選擇。」
Thomas Kurian 在訪談中毫不諱言地指出,Google 自家的 TPU(張量處理單元)已經不是實驗室玩具,而是真正能與輝達正面對決的商用武器。他透露了一個驚人的數據:Google Cloud 上超過 50% 的 AI 訓練工作負載,現在都跑在 TPU 上。 這不是小眾玩家的選擇,這包括 Anthropic 這種頂級 AI 公司在內。
為什麼 TPU 能威脅輝達?因為它被設計成一個「系統」,而不是一顆孤立的晶片。Kurian 形容,TPU 與 Google 的網路架構、軟體堆疊(如 JAX 和 TensorFlow)深度整合,形成了一個「超級電腦級別的叢集」。這意味著,當你需要訓練一個擁有數千億參數的模型時,TPU 的「集群效率」比輝達的 GPU 更高,成本更低。
「我們不是在跟輝達比賽誰的晶片算力更強,我們在比賽誰能讓你的模型更快、更便宜地跑起來。」Kurian 這句話,直接點出了 Google 的戰略核心:算力不是重點,總擁有成本(TCO)才是。
對於科技愛好者來說,這是一個巨大的信號:不要只盯著輝達的股價,Google 的 TPU 正在悄悄吃掉企業級 AI 部署的市場。 如果你正在考慮為你的公司選擇雲端平台,而你的 AI 模型需要大規模訓練,現在是時候認真考慮 Google Cloud 和 TPU 了。
2. Anthropic 的「神話級」模型:不是 ChatGPT 殺手,而是全新物種
提到 Anthropic,多數人會想到 Claude。但 Kurian 在訪談中透露了一個更令人興奮的消息:Anthropic 正在開發一個代號為「Mythos」的模型。這不是 Claude 的升級版,而是一個「完全不同範疇」的東西。
Kurian 沒有給出具體細節,但他用了「令人難以置信的推理能力」和「幾乎超越人類的邏輯鏈」來形容它。他甚至暗示,這個模型可能會徹底改變我們對「AI 能做些什麼」的想像。
「我們與 Anthropic 的合作,不僅僅是提供算力。我們在共同定義下一代 AI 的基礎設施。Mythos 將需要前所未有的記憶體頻寬和網路延遲,而 Google 的 TPU 叢集是唯一能滿足它的平台。」
這段話的潛台詞是什麼?Anthropic 正在跳脫「對話式 AI」的框架,轉向「推理型 AI」。 這意味著,未來的 AI 不再是跟你聊天,而是能像人類一樣,進行多步驟的邏輯推演、解決複雜的數學問題,甚至撰寫法律文件或程式碼。
這對開發者來說是一個巨大的警訊:如果你還在用 ChatGPT 或 Claude 寫簡單的文案,你可能已經落伍了。下一波 AI 應用將圍繞「推理」展開,而這需要全新的模型和全新的硬體支援。 如果你是創業者,現在就該思考:你的產品如何利用這種「超推理」能力?
3. 為什麼 Google Cloud 敢對 NVIDIA 說「不」?
這是最反直覺的一點。大家都知道 NVIDIA 的 GPU 供不應求,價格高得離譜。但 Kurian 卻直言:「我們不擔心 NVIDIA 的供應問題,因為我們有自己的備案。」
這個備案不僅僅是 TPU。Google 還與 Intel 和 AMD 建立了深度合作,推出客製化的 AI 晶片。Kurian 說:「我們希望給客戶選擇權。如果你喜歡 NVIDIA 的 CUDA 生態,我們有 A3 系列。如果你想要更低的成本,我們有基於 AMD MI300 的解決方案。如果你想要極致的性能,我們有 TPU v5。」
這是一個典型的「多雲、多晶片」策略。Google 不想被任何一家供應商綁架,尤其是當 NVIDIA 的 GPU 價格已經高到讓許多新創公司望而卻步時。
對於企業 IT 決策者來說,這意味著你不再需要被 NVIDIA 的定價綁架。你可以根據你的預算和模型需求,選擇最適合的晶片。 如果你的模型是基於 Transformer 架構,TPU 可能是最佳選擇。如果你需要更靈活的框架支援,AMD 或 Intel 的方案可能更划算。Google Cloud 正在變成一個「晶片超市」,而不是輝達的專賣店。
4. AI 的「長尾效應」:不是只有大模型才賺錢
當大家都在談論 GPT-4 和 Gemini 時,Kurian 點出了一個常被忽略的事實:大多數企業根本不需要訓練一個千億參數的模型。
「我們看到越來越多客戶在 Google Cloud 上使用我們的 Vertex AI 平台,來微調一個只有 70 億參數的開源模型,比如 Llama 3 或 Gemma。」Kurian 說,「對他們來說,成本降低 90%,性能卻能滿足 95% 的場景。」
這就是 AI 的「長尾效應」。真正賺錢的不是那些開發基礎模型的巨頭,而是那些利用這些模型來解決特定問題的中小企業。例如,一家保險公司用微調後的模型來自動審核理賠文件,一家物流公司用它來優化配送路線。
對於開發者來說,這是一個極其重要的啟示:不要試圖打造下一個 ChatGPT,而是去打造一個能幫牙醫預約病患、幫律師查閱判例的「小模型」。 這些應用不需要頂尖的通用智能,只需要在特定領域做到 99% 的準確率。而 Google Cloud 的 Vertex AI 讓這件事變得前所未有的簡單。
5. 神話不再:為什麼 Google 不怕 OpenAI 的「神話」?
訪談中有一個有趣的片段。當主持人 Matthew Berman 問到 OpenAI 的「Q*」和「神話」模型時,Kurian 笑了。他沒有直接評論 OpenAI,而是說:「每個人都喜歡神話,但真正的突破來自於工程上的持續改進。」
他進一步解釋,Google 的 DeepMind 團隊在 AI 領域有超過十年的積累,從 AlphaGo 到 AlphaFold,再到現在的 Gemini。這些都不是一夜之間冒出來的神話,而是建立在紮實的基礎研究之上。
「我們不追求轟動效應,我們追求的是可以持續迭代、可靠、安全的模型。」Kurian 說,「當你的模型每天被數十億用戶使用時,你不能冒險。」
這段話的弦外之音非常明顯:OpenAI 的「神話」可能只是行銷噱頭,而 Google 的「工程」才是真正的護城河。 對於投資者和開發者來說,這意味著你應該更關注那些有實際產品和用戶基礎的公司,而不是那些只會發布驚人演示的團隊。
6. 雲端 AI 的「軍火商」:誰控制了基礎設施,誰就控制了未來
這是最宏觀也最令人不安的要點。Kurian 在訪談中多次強調,Google Cloud 的定位不是 AI 應用公司,而是 AI 基礎設施公司。
「我們不跟客戶競爭。我們不開發 ChatGPT 的競爭對手。我們提供的是讓你能開發 ChatGPT 的工具。」Kurian 說。
這是一個極其聰明的策略。當 OpenAI、Anthropic、Meta 都在爭奪消費者的注意力時,Google Cloud 默默地成為了它們共同的「軍火商」。無論誰贏得消費者的心,Google 都能從中獲利,因為它們都在使用 Google 的雲端服務。
對於科技工作者來說,這意味著你應該開始關注雲端基礎設施的股票,而不是單一 AI 公司的股票。 因為無論 AI 的贏家是誰,雲端平台都會是最大的受益者。Google Cloud、AWS 和 Azure 正在瓜分這個市場,而 Google Cloud 憑藉 TPU 和 Vertex AI 的差異化優勢,正在加速追趕。
7. 2026 年的 AI 地圖:我們已經在哪裡,下一步怎麼走?
Kurian 在訪談結尾描繪了一幅 2026 年的 AI 地圖。他認為,我們已經度過了「探索期」,進入了「工程化期」。
- 探索期(2022–2024):大家都在嘗試各種模型架構,GPT 崛起,開源模型百花齊放。
- 工程化期(2025–2026):模型架構趨於穩定,重點轉向如何降低成本、提高可靠性、部署到生產環境。
「2026 年的關鍵字是『可靠』和『成本』。」Kurian 說,「企業不再在乎你的模型有多聰明,他們在乎的是它能不能 24/7 不當機,以及每次 API 呼叫的成本是多少。」
這意味著,那些能夠提供穩定、低成本、易於部署的解決方案的公司,將在未來兩年勝出。 這對於新創公司來說是一個巨大的機會:不要試圖發明新的模型架構,而是去發明一個能讓現有模型跑得更便宜、更快的工具。
重點整理表格
| 核心要點 | 關鍵數據/案例 | 對讀者的影響 |
|---|---|---|
| TPU vs. NVIDIA | Google Cloud 上 50%+ AI 工作負載跑在 TPU 上 | 選擇雲端平台時,考慮 TPU 的 TCO 優勢 |
| Anthropic「Mythos」 | 推理能力「超越人類」,需要前所未有的硬體 | 下一波 AI 應用將圍繞「推理」展開 |
| 多晶片策略 | 與 Intel、AMD 合作,提供 NVIDIA 替代方案 | 企業不再被單一晶片供應商綁架 |
| 長尾效應 | 微調 70 億參數模型可滿足 95% 場景,成本降 90% | 開發者應聚焦特定領域的「小模型」 |
| 工程 vs. 神話 | Google 強調持續迭代 vs. OpenAI 的轟動效應 | 投資者應關注有實際產品的公司 |
| 軍火商策略 | Google Cloud 不與客戶競爭,只提供基礎設施 | 雲端基礎設施股票是 AI 時代的確定性機會 |
| 2026 年關鍵字 | 可靠、成本、工程化 | 新創應聚焦降低部署成本和提升穩定性 |
總結:下一個戰場不在模型,而在基礎設施
這場訪談讓我們看到了一個殘酷的現實:AI 的軍備競賽已經從「誰的模型更聰明」,變成了「誰的基礎設施更便宜、更可靠」。 Google Cloud 正在利用 TPU 和多晶片策略,悄悄地成為這場競賽中的「最大莊家」。
而對於你——無論你是開發者、創業者還是投資者——最該問自己的問題不是「下一個 ChatGPT 是什麼?」,而是:
「當所有 AI 模型都變得一樣聰明時,我該如何確保我的應用跑得比別人快、成本比別人低?」
答案,很可能就藏在 Google Cloud 的資料中心裡。