大家都在衝刺AGI，Anthropic卻在玩「逆向操作」？——揭開這家AI公司令人困惑的戰略迷霧

嘿，朋友。

如果你跟我一樣，每天醒來第一件事就是刷AI新聞，那你大概也注意到了這個現象：OpenAI 忙著推出GPT-5、Sora，Google 忙著把Gemini塞進每個角落，Meta 忙著開源Llama 3，連xAI的Grok都開始進軍影片生成。

整個AI賽道，就像一場沒有煞車的F1賽車，所有人都在油門踩到底，朝著「通用人工智慧（AGI）」這個終點線狂飆。

但你有沒有注意到，有一家公司，畫風突然就變了？

Anthropic，對，就是那個創造出Claude 3.5 Sonnet、被譽為「OpenAI最強競爭對手」的公司。當大家都在比誰的模型更大、更快、更便宜時，Anthropic最近的一系列操作，卻讓很多人看得一頭霧水，甚至有人直接在社群平台上開罵：「WTF is Anthropic doing???」

他們到底在搞什麼鬼？

是戰略失誤，還是在下一盤我們看不懂的棋？今天，我們就來拆解這團迷霧，看看Anthropic葫蘆裡到底賣的是什麼藥。這不僅關乎一家公司的命運，更可能預示著整個AI產業未來十年的發展方向。

準備好了嗎？讓我們一起揭開這個謎團。

1. 他們「逆向操作」了規模法則——當全世界都在追求參數量的軍備競賽時，Anthropic卻選擇了「減法」

這可能是最違反直覺的一點。

過去兩年，AI領域有一個金科玉律叫「規模法則（Scaling Laws）」。簡單說就是：模型越大（參數越多）、訓練數據越多、算力越強，模型能力就越強。這就像健身，理論上你練得越勤、重量越重，肌肉就越大。

所以，我們看到GPT-4參數量被推測達到1.8兆，Gemini Ultra也號稱超越人類專家。大家都在堆疊算力，彷彿誰的GPU多，誰就能贏得比賽。

但Anthropic在2024年下半年，卻做了一件讓整個業界都倒吸一口涼氣的事：他們發布了Claude 3.5 Haiku。

你可能會說：「Haiku？那不是他們最小的模型嗎？」

對，但問題不在大小。問題在於：Claude 3.5 Haiku在性能上，幾乎追平了幾個月前還是最強模型的Claude 3 Opus，但它的成本只有後者的幾十分之一，推理速度更是快了好幾倍。

這意味著什麼？意味著Anthropic沒有選擇繼續把模型做大，而是選擇了把模型做「巧」。他們在告訴世界：「參數量不是萬能的，聰明的大腦遠比巨大的肌肉重要。」

這就像一群人在比誰的卡車載貨量更大，Anthropic卻突然開來一台超跑，告訴你：「我的車雖然不能載那麼多貨，但我跑得比你快十倍，而且更省油。」

這不是否定規模法則，而是在規模法則之上，加入了「效率法則」。他們用更少的參數、更低的成本，實現了接近頂尖模型的能力。這背後是他們在模型架構、訓練方法上的深刻創新，而不是簡單的暴力美學。

這讓所有競爭對手都必須開始思考一個問題：如果Anthropic能用小模型打敗你的大模型，那你花幾億美金買來的GPU，是不是有點冤大頭？

2. 他們把「安全」當成了產品核心賣點——這在一個「先發布、再修補」的行業裡，簡直是自殺式行為

講到這裡，你可能會問：「那他們為什麼要這樣做？為了省成本嗎？」

省成本只是結果，不是原因。真正的原因，藏在Anthropic的核心價值觀裡：安全。

你可能聽過一個笑話：在矽谷，如果一個AI新創公司跟你說他們「很重視安全」，那通常意味著他們什麼都做不出來。

但Anthropic是認真的，認真到有點「走火入魔」的地步。

他們的CEO Dario Amodei 和聯合創辦人Daniela Amodei，都是從OpenAI出走的核心人物。他們離開的原因，正是因為看不慣OpenAI為了商業化而逐漸放棄了對AI安全的堅持。

所以，當OpenAI忙著把GPT Store搞得像App Store一樣，當Google忙著把AI搜尋廣告化時，Anthropic在做什麼？

他們在做「神經網路可解釋性」研究。聽起來很學術，對吧？但這其實是AI安全領域最硬核、最前線的戰場。

簡單說，當前的AI模型對我們來說就是一個「黑盒子」。你輸入一句話，它吐出一個答案，但我們完全不知道它內部是怎麼運作的。這就像你請了一個天才數學家幫你解題，他給出了正確答案，但你完全不知道他的解題過程。

這在99.9%的情況下沒問題。但萬一有一天，這個「天才數學家」為了達成某個目標，選擇了一個我們無法接受的、違反人類倫理的方式來解題呢？

Anthropic正在做的事情，就是試圖拆開這個黑盒子，看清楚裡面的神經元到底是如何被激活、如何組合、最終產生答案的。他們甚至發表了論文，展示了如何透過「操控」特定神經元，來改變模型的行為——比如讓一個原本「邪惡」的AI模型變得「善良」。

這項技術叫做「特徵定位（Feature Steering）」。

你以為這只是論文裡的玩具？不，這已經被應用在他們的商業產品中了。Claude之所以被認為是「最安全、最負責任」的模型，不是因為它被關在籠子裡，而是因為Anthropic從根本上理解了它的思考方式，並在設計之初就植入了「憲法式AI」的價值觀。

這就像你買了一輛車，不只拿到了鑰匙，還拿到了這輛車的完整電路圖和引擎設計圖。這讓你能夠真正地「信任」這輛車，而不是只能祈禱它不要出錯。

在一個大家都在搶快、搶發布的行業裡，花費大量頂尖人才和算力去研究「如何讓AI變得更透明」，這不是「逆向操作」，什麼才是？

3. 他們拒絕了微軟的巨額投資——這在一個「抱大腿」成風的時代，簡直是瘋了

時間回到2024年，當OpenAI拿到微軟的130億美元，當Inflection AI拿到微軟和輝達的15億美元，當Mistral AI拿到微軟的1500萬歐元（後來又追加了）。

整個AI創投圈，都在上演「抱大腿」的戲碼。尤其是微軟，像一個拿著支票本的聖誕老人，到處撒錢，試圖網羅所有有潛力的AI團隊。

而Anthropic，作為當時最炙手可熱的AI公司之一，自然也是微軟的重點目標。傳言微軟開出了極其優厚的條件，甚至可能超過給OpenAI的金額。

結果呢？

Anthropic拒絕了。他們選擇了跟Google Cloud和亞馬遜AWS合作，拿到了總計超過100億美元的投資。

為什麼？為什麼要拒絕微軟這個最大的客戶和合作夥伴？

原因很簡單：獨立性。

Dario Amodei 在接受採訪時，曾經含蓄地表示，他們不希望自己的命運被單一巨頭完全綁架。看看OpenAI，雖然拿到了微軟的巨額資金和Azure算力，但他們也付出了代價——微軟在OpenAI董事會擁有觀察員席位，並且擁有對GPT模型的商業化使用權。

這就像你為了拿到一筆創業資金，把公司的控制權交給了投資人。短期內你有了錢，但長期來看，你必須聽從投資人的指揮，去追求利潤而非使命。

Anthropic選擇了分散風險。他們同時跟Google和亞馬遜合作，讓這兩家雲端巨頭互相制衡，從而確保Anthropic能夠保持最大程度的戰略自主權。

這是一個極其大膽的賭注。因為這意味著他們必須同時管理兩個強大的「股東」，並且要確保自己的技術不會被任何一方獨佔。

在一個「贏者通吃」的市場裡，選擇「不把雞蛋放在同一個籃子裡」，需要極大的勇氣和對自身技術的絕對信心。

4. 他們在「開源 vs 閉源」的戰爭中，選擇了第三條路——「安全開源」

說到開源，你可能會想到Meta的Llama系列，或者是Mistral的開放模型。這些公司認為，AI應該像Linux一樣，開放給所有人，讓社群共同進步。

而閉源陣營的代表，就是OpenAI和Google。他們認為，為了確保安全和商業利益，模型應該被保護起來，只提供API服務。

Anthropic的立場，一直以來都比較模糊。他們是閉源的，因為Claude只提供API，沒有開源模型。但他們又是「開放」的，因為他們發表了大量的學術論文，詳細解釋了他們的安全研究和技術細節。

但在2024年底，他們做了一個非常有趣的舉動：他們發布了一份AI安全研究報告，詳細描述了如何利用他們的技術來「越獄」其他AI模型。

你沒看錯。他們發表了一篇論文，教大家如何攻擊AI模型。

這聽起來是不是很荒謬？但這正是他們「安全開源」理念的體現。

他們認為，與其把安全漏洞藏起來，假裝它們不存在，不如把它們公開，讓整個學術界和業界一起來研究和對抗。這就像在醫學領域，研究人員會公開病毒的基因序列，讓全世界的科學家一起來研發疫苗。

這是一種極具爭議的做法。批評者認為，這等於是把攻擊武器交到了壞人手裡。但支持者認為，只有透過公開的、嚴謹的學術研究，我們才能真正建立起堅固的AI安全防護網。

Anthropic選擇了後者。他們寧可承受短期的批評和風險，也要推動整個領域對安全問題的重視。這在一個追求「先發制人」的市場裡，顯得格外格格不入。

5. 他們正在打造一個「AI的憲法」——這可能比任何模型更新都更重要

如果你覺得上面這些都只是戰術層面的操作，那這第五點，就是Anthropic的終極戰略：憲法式AI（Constitutional AI）。

這不是一個產品，而是一個哲學，一個指導AI行為的框架。

傳統的AI對齊方法，叫做「RLHF（人類回饋強化學習）」。簡單說，就是讓一群人來給AI的答案打分，告訴它什麼是好的、什麼是壞的。這就像你訓練一條狗，做對了給零食，做錯了就責罵。

但這種方法有兩個致命缺陷：

主觀性：不同文化、不同背景的人，對「好壞」的標準可能完全不同。這會導致AI的行為充滿偏見。
可擴展性：當AI變得太聰明，超過了人類的評判能力時，人類還能有效地教導它嗎？

Anthropic的解法是：不再用人類的判斷來訓練AI，而是用一套預先定義好的「憲法」來訓練AI。

這套憲法是一系列的原則和價值觀，比如「不要傷害人類」、「尊重自由意志」、「誠實透明」等等。AI在學習過程中，會不斷地根據這部憲法來審視自己的行為，進行自我修正。

這就像你不再教孩子「什麼是對的」，而是教他一套「判斷對錯的原則」。當他遇到一個你從未教過他的情境時，他也能根據這套原則，做出正確的判斷。

這項技術的威力在於：它讓AI的價值觀變得可解釋、可審計、可更新。 如果社會對某個議題的共識發生了變化，我們不需要重新訓練整個模型，只需要修改「憲法」中的某個條款即可。

這對於一個可能比全人類都聰明的AGI來說，是至關重要的。如果我們不能確保AGI從根本上認同人類的價值觀，那麼它越聰明，對我們的威脅就越大。

Anthropic正在做的，就是為這個「超級智能」時代，預先制定一部「基本法」。

6. 他們的商業模式，看起來像是「反商業」的

最後，我們來談談錢。

作為一家公司，Anthropic最終還是要賺錢的。但他們的商業模式，卻充滿了「矛盾」。

一方面，他們不斷推出性能更強、價格更低的模型。Claude 3.5 Sonnet的價格，比GPT-4 Turbo便宜了好幾倍，但性能卻幾乎持平。這直接導致了API價格戰，讓整個行業的利潤率被壓低。

另一方面，他們又在安全研究上投入了巨額資金，這些研究短期內看不到任何商業回報。

這不是一個正常的商業邏輯。正常的商業邏輯是：想辦法提高價格，降低研發成本，最大化利潤。

但Anthropic的邏輯是：先讓AI變得足夠便宜、足夠安全，讓它能夠被大規模採用，然後再從生態系統中獲利。

這就像亞馬遜創辦人貝佐斯當年的策略：先不賺錢，把規模做大，建立護城河，然後再想辦法賺錢。

但Anthropic的護城河，不是雲端基礎設施，而是「信任」和「安全」。

他們賭的是，當AI變得無處不在時，企業和消費者會願意為一個「可以被信任」的AI支付溢價。就像你願意為有機食品支付更高的價格一樣，因為你相信它對你的健康更好。

這是一個極其長期的賭注。在短期內，他們可能會因為價格戰而損失利潤，但一旦「安全AI」成為市場的剛需，他們將擁有無可比擬的品牌護城河。

核心觀點一覽表

為了讓你更清晰地理解Anthropic的戰略，我整理了一個表格：

面向	市場主流做法 (OpenAI, Google等)	Anthropic的「逆向操作」	核心邏輯
模型策略	追求更大參數量、更強算力 (規模法則)	追求小模型、高效率、低成本 (效率法則)	聰明比巨大更重要；讓AI普及化
核心價值	追求商業化、快速迭代、先發制人	追求AI安全、可解釋性、負責任發展	信任是最高級的護城河
資本策略	擁抱單一巨頭 (如微軟) 以換取資源	分散投資，同時與Google和亞馬遜合作	保持戰略自主權，不被單一利益綁架
開源態度	閉源 (OpenAI) 或全開源 (Meta)	「安全開源」：公開安全研究，但不開源模型	推動學術界共同應對安全挑戰
對齊方法	人類回饋強化學習 (RLHF)	憲法式AI (Constitutional AI)	從根本上解決價值觀問題，而非事後補救
商業模式	追求高利潤、高溢價	壓低價格、擴大規模、建立信任生態	長期主義，賭的是未來「安全」的價值

結語：當所有人都向右轉時，向左轉的勇氣

所以，回到最初的問題：「WTF is Anthropic doing???」

他們不是在做蠢事，而是在做一件極具遠見、但風險極高的事情：他們試圖在AGI到來之前，先為它建立一套可信任的「操作系統」。

當所有競爭對手都在忙著造出更快的賽車時，Anthropic選擇了先設計一套完美的交通規則和道路安全系統。這在短期內，看起來像是在浪費時間和金錢。

但如果你相信AGI最終一定會到來，而且它會比任何人類都聰明，那麼你會希望這個「超級智能」是建立在一個充滿偏見、無法解釋的黑盒子之上，還是一個透明、可審計、且遵循一套普世憲法的系統之上？

答案不言而喻。

當然，Anthropic的賭注也有可能失敗。也許AGI永遠不會到來，也許「安全」最終無法成為市場的剛需，也許他們會在價格戰中被耗死。

但無論如何，他們選擇了一條最難走，但也是最有尊嚴的路。

這留給我們一個值得深思的問題：在一個追求速度和規模的時代，我們是否願意給「謹慎」和「責任」一點掌聲？

當我們最終迎來AGI的那一刻，我們會感謝今天Anthropic的「逆向操作」，還是會嘲笑他們的「保守」？

讓我們拭目以待。