大家都在衝刺AGI,Anthropic卻在玩「逆向操作」?——揭開這家AI公司令人困惑的戰略迷霧
嘿,朋友。
如果你跟我一樣,每天醒來第一件事就是刷AI新聞,那你大概也注意到了這個現象:OpenAI 忙著推出GPT-5、Sora,Google 忙著把Gemini塞進每個角落,Meta 忙著開源Llama 3,連xAI的Grok都開始進軍影片生成。
整個AI賽道,就像一場沒有煞車的F1賽車,所有人都在油門踩到底,朝著「通用人工智慧(AGI)」這個終點線狂飆。
但你有沒有注意到,有一家公司,畫風突然就變了?
Anthropic,對,就是那個創造出Claude 3.5 Sonnet、被譽為「OpenAI最強競爭對手」的公司。當大家都在比誰的模型更大、更快、更便宜時,Anthropic最近的一系列操作,卻讓很多人看得一頭霧水,甚至有人直接在社群平台上開罵:「WTF is Anthropic doing???」
他們到底在搞什麼鬼?
是戰略失誤,還是在下一盤我們看不懂的棋?今天,我們就來拆解這團迷霧,看看Anthropic葫蘆裡到底賣的是什麼藥。這不僅關乎一家公司的命運,更可能預示著整個AI產業未來十年的發展方向。
準備好了嗎?讓我們一起揭開這個謎團。
1. 他們「逆向操作」了規模法則——當全世界都在追求參數量的軍備競賽時,Anthropic卻選擇了「減法」
這可能是最違反直覺的一點。
過去兩年,AI領域有一個金科玉律叫「規模法則(Scaling Laws)」。簡單說就是:模型越大(參數越多)、訓練數據越多、算力越強,模型能力就越強。這就像健身,理論上你練得越勤、重量越重,肌肉就越大。
所以,我們看到GPT-4參數量被推測達到1.8兆,Gemini Ultra也號稱超越人類專家。大家都在堆疊算力,彷彿誰的GPU多,誰就能贏得比賽。
但Anthropic在2024年下半年,卻做了一件讓整個業界都倒吸一口涼氣的事:他們發布了Claude 3.5 Haiku。
你可能會說:「Haiku?那不是他們最小的模型嗎?」
對,但問題不在大小。問題在於:Claude 3.5 Haiku在性能上,幾乎追平了幾個月前還是最強模型的Claude 3 Opus,但它的成本只有後者的幾十分之一,推理速度更是快了好幾倍。
這意味著什麼?意味著Anthropic沒有選擇繼續把模型做大,而是選擇了把模型做「巧」。他們在告訴世界:「參數量不是萬能的,聰明的大腦遠比巨大的肌肉重要。」
這就像一群人在比誰的卡車載貨量更大,Anthropic卻突然開來一台超跑,告訴你:「我的車雖然不能載那麼多貨,但我跑得比你快十倍,而且更省油。」
這不是否定規模法則,而是在規模法則之上,加入了「效率法則」。他們用更少的參數、更低的成本,實現了接近頂尖模型的能力。這背後是他們在模型架構、訓練方法上的深刻創新,而不是簡單的暴力美學。
這讓所有競爭對手都必須開始思考一個問題:如果Anthropic能用小模型打敗你的大模型,那你花幾億美金買來的GPU,是不是有點冤大頭?
2. 他們把「安全」當成了產品核心賣點——這在一個「先發布、再修補」的行業裡,簡直是自殺式行為
講到這裡,你可能會問:「那他們為什麼要這樣做?為了省成本嗎?」
省成本只是結果,不是原因。真正的原因,藏在Anthropic的核心價值觀裡:安全。
你可能聽過一個笑話:在矽谷,如果一個AI新創公司跟你說他們「很重視安全」,那通常意味著他們什麼都做不出來。
但Anthropic是認真的,認真到有點「走火入魔」的地步。
他們的CEO Dario Amodei 和聯合創辦人Daniela Amodei,都是從OpenAI出走的核心人物。他們離開的原因,正是因為看不慣OpenAI為了商業化而逐漸放棄了對AI安全的堅持。
所以,當OpenAI忙著把GPT Store搞得像App Store一樣,當Google忙著把AI搜尋廣告化時,Anthropic在做什麼?
他們在做「神經網路可解釋性」研究。聽起來很學術,對吧?但這其實是AI安全領域最硬核、最前線的戰場。
簡單說,當前的AI模型對我們來說就是一個「黑盒子」。你輸入一句話,它吐出一個答案,但我們完全不知道它內部是怎麼運作的。這就像你請了一個天才數學家幫你解題,他給出了正確答案,但你完全不知道他的解題過程。
這在99.9%的情況下沒問題。但萬一有一天,這個「天才數學家」為了達成某個目標,選擇了一個我們無法接受的、違反人類倫理的方式來解題呢?
Anthropic正在做的事情,就是試圖拆開這個黑盒子,看清楚裡面的神經元到底是如何被激活、如何組合、最終產生答案的。他們甚至發表了論文,展示了如何透過「操控」特定神經元,來改變模型的行為——比如讓一個原本「邪惡」的AI模型變得「善良」。
這項技術叫做「特徵定位(Feature Steering)」。
你以為這只是論文裡的玩具?不,這已經被應用在他們的商業產品中了。Claude之所以被認為是「最安全、最負責任」的模型,不是因為它被關在籠子裡,而是因為Anthropic從根本上理解了它的思考方式,並在設計之初就植入了「憲法式AI」的價值觀。
這就像你買了一輛車,不只拿到了鑰匙,還拿到了這輛車的完整電路圖和引擎設計圖。這讓你能夠真正地「信任」這輛車,而不是只能祈禱它不要出錯。
在一個大家都在搶快、搶發布的行業裡,花費大量頂尖人才和算力去研究「如何讓AI變得更透明」,這不是「逆向操作」,什麼才是?
3. 他們拒絕了微軟的巨額投資——這在一個「抱大腿」成風的時代,簡直是瘋了
時間回到2024年,當OpenAI拿到微軟的130億美元,當Inflection AI拿到微軟和輝達的15億美元,當Mistral AI拿到微軟的1500萬歐元(後來又追加了)。
整個AI創投圈,都在上演「抱大腿」的戲碼。尤其是微軟,像一個拿著支票本的聖誕老人,到處撒錢,試圖網羅所有有潛力的AI團隊。
而Anthropic,作為當時最炙手可熱的AI公司之一,自然也是微軟的重點目標。傳言微軟開出了極其優厚的條件,甚至可能超過給OpenAI的金額。
結果呢?
Anthropic拒絕了。他們選擇了跟Google Cloud和亞馬遜AWS合作,拿到了總計超過100億美元的投資。
為什麼?為什麼要拒絕微軟這個最大的客戶和合作夥伴?
原因很簡單:獨立性。
Dario Amodei 在接受採訪時,曾經含蓄地表示,他們不希望自己的命運被單一巨頭完全綁架。看看OpenAI,雖然拿到了微軟的巨額資金和Azure算力,但他們也付出了代價——微軟在OpenAI董事會擁有觀察員席位,並且擁有對GPT模型的商業化使用權。
這就像你為了拿到一筆創業資金,把公司的控制權交給了投資人。短期內你有了錢,但長期來看,你必須聽從投資人的指揮,去追求利潤而非使命。
Anthropic選擇了分散風險。他們同時跟Google和亞馬遜合作,讓這兩家雲端巨頭互相制衡,從而確保Anthropic能夠保持最大程度的戰略自主權。
這是一個極其大膽的賭注。因為這意味著他們必須同時管理兩個強大的「股東」,並且要確保自己的技術不會被任何一方獨佔。
在一個「贏者通吃」的市場裡,選擇「不把雞蛋放在同一個籃子裡」,需要極大的勇氣和對自身技術的絕對信心。
4. 他們在「開源 vs 閉源」的戰爭中,選擇了第三條路——「安全開源」
說到開源,你可能會想到Meta的Llama系列,或者是Mistral的開放模型。這些公司認為,AI應該像Linux一樣,開放給所有人,讓社群共同進步。
而閉源陣營的代表,就是OpenAI和Google。他們認為,為了確保安全和商業利益,模型應該被保護起來,只提供API服務。
Anthropic的立場,一直以來都比較模糊。他們是閉源的,因為Claude只提供API,沒有開源模型。但他們又是「開放」的,因為他們發表了大量的學術論文,詳細解釋了他們的安全研究和技術細節。
但在2024年底,他們做了一個非常有趣的舉動:他們發布了一份AI安全研究報告,詳細描述了如何利用他們的技術來「越獄」其他AI模型。
你沒看錯。他們發表了一篇論文,教大家如何攻擊AI模型。
這聽起來是不是很荒謬?但這正是他們「安全開源」理念的體現。
他們認為,與其把安全漏洞藏起來,假裝它們不存在,不如把它們公開,讓整個學術界和業界一起來研究和對抗。這就像在醫學領域,研究人員會公開病毒的基因序列,讓全世界的科學家一起來研發疫苗。
這是一種極具爭議的做法。批評者認為,這等於是把攻擊武器交到了壞人手裡。但支持者認為,只有透過公開的、嚴謹的學術研究,我們才能真正建立起堅固的AI安全防護網。
Anthropic選擇了後者。他們寧可承受短期的批評和風險,也要推動整個領域對安全問題的重視。這在一個追求「先發制人」的市場裡,顯得格外格格不入。
5. 他們正在打造一個「AI的憲法」——這可能比任何模型更新都更重要
如果你覺得上面這些都只是戰術層面的操作,那這第五點,就是Anthropic的終極戰略:憲法式AI(Constitutional AI)。
這不是一個產品,而是一個哲學,一個指導AI行為的框架。
傳統的AI對齊方法,叫做「RLHF(人類回饋強化學習)」。簡單說,就是讓一群人來給AI的答案打分,告訴它什麼是好的、什麼是壞的。這就像你訓練一條狗,做對了給零食,做錯了就責罵。
但這種方法有兩個致命缺陷:
- 主觀性:不同文化、不同背景的人,對「好壞」的標準可能完全不同。這會導致AI的行為充滿偏見。
- 可擴展性:當AI變得太聰明,超過了人類的評判能力時,人類還能有效地教導它嗎?
Anthropic的解法是:不再用人類的判斷來訓練AI,而是用一套預先定義好的「憲法」來訓練AI。
這套憲法是一系列的原則和價值觀,比如「不要傷害人類」、「尊重自由意志」、「誠實透明」等等。AI在學習過程中,會不斷地根據這部憲法來審視自己的行為,進行自我修正。
這就像你不再教孩子「什麼是對的」,而是教他一套「判斷對錯的原則」。當他遇到一個你從未教過他的情境時,他也能根據這套原則,做出正確的判斷。
這項技術的威力在於:它讓AI的價值觀變得可解釋、可審計、可更新。 如果社會對某個議題的共識發生了變化,我們不需要重新訓練整個模型,只需要修改「憲法」中的某個條款即可。
這對於一個可能比全人類都聰明的AGI來說,是至關重要的。如果我們不能確保AGI從根本上認同人類的價值觀,那麼它越聰明,對我們的威脅就越大。
Anthropic正在做的,就是為這個「超級智能」時代,預先制定一部「基本法」。
6. 他們的商業模式,看起來像是「反商業」的
最後,我們來談談錢。
作為一家公司,Anthropic最終還是要賺錢的。但他們的商業模式,卻充滿了「矛盾」。
一方面,他們不斷推出性能更強、價格更低的模型。Claude 3.5 Sonnet的價格,比GPT-4 Turbo便宜了好幾倍,但性能卻幾乎持平。這直接導致了API價格戰,讓整個行業的利潤率被壓低。
另一方面,他們又在安全研究上投入了巨額資金,這些研究短期內看不到任何商業回報。
這不是一個正常的商業邏輯。正常的商業邏輯是:想辦法提高價格,降低研發成本,最大化利潤。
但Anthropic的邏輯是:先讓AI變得足夠便宜、足夠安全,讓它能夠被大規模採用,然後再從生態系統中獲利。
這就像亞馬遜創辦人貝佐斯當年的策略:先不賺錢,把規模做大,建立護城河,然後再想辦法賺錢。
但Anthropic的護城河,不是雲端基礎設施,而是「信任」和「安全」。
他們賭的是,當AI變得無處不在時,企業和消費者會願意為一個「可以被信任」的AI支付溢價。就像你願意為有機食品支付更高的價格一樣,因為你相信它對你的健康更好。
這是一個極其長期的賭注。在短期內,他們可能會因為價格戰而損失利潤,但一旦「安全AI」成為市場的剛需,他們將擁有無可比擬的品牌護城河。
核心觀點一覽表
為了讓你更清晰地理解Anthropic的戰略,我整理了一個表格:
| 面向 | 市場主流做法 (OpenAI, Google等) | Anthropic的「逆向操作」 | 核心邏輯 |
|---|---|---|---|
| 模型策略 | 追求更大參數量、更強算力 (規模法則) | 追求小模型、高效率、低成本 (效率法則) | 聰明比巨大更重要;讓AI普及化 |
| 核心價值 | 追求商業化、快速迭代、先發制人 | 追求AI安全、可解釋性、負責任發展 | 信任是最高級的護城河 |
| 資本策略 | 擁抱單一巨頭 (如微軟) 以換取資源 | 分散投資,同時與Google和亞馬遜合作 | 保持戰略自主權,不被單一利益綁架 |
| 開源態度 | 閉源 (OpenAI) 或 全開源 (Meta) | 「安全開源」:公開安全研究,但不開源模型 | 推動學術界共同應對安全挑戰 |
| 對齊方法 | 人類回饋強化學習 (RLHF) | 憲法式AI (Constitutional AI) | 從根本上解決價值觀問題,而非事後補救 |
| 商業模式 | 追求高利潤、高溢價 | 壓低價格、擴大規模、建立信任生態 | 長期主義,賭的是未來「安全」的價值 |
結語:當所有人都向右轉時,向左轉的勇氣
所以,回到最初的問題:「WTF is Anthropic doing???」
他們不是在做蠢事,而是在做一件極具遠見、但風險極高的事情:他們試圖在AGI到來之前,先為它建立一套可信任的「操作系統」。
當所有競爭對手都在忙著造出更快的賽車時,Anthropic選擇了先設計一套完美的交通規則和道路安全系統。這在短期內,看起來像是在浪費時間和金錢。
但如果你相信AGI最終一定會到來,而且它會比任何人類都聰明,那麼你會希望這個「超級智能」是建立在一個充滿偏見、無法解釋的黑盒子之上,還是一個透明、可審計、且遵循一套普世憲法的系統之上?
答案不言而喻。
當然,Anthropic的賭注也有可能失敗。也許AGI永遠不會到來,也許「安全」最終無法成為市場的剛需,也許他們會在價格戰中被耗死。
但無論如何,他們選擇了一條最難走,但也是最有尊嚴的路。
這留給我們一個值得深思的問題:在一個追求速度和規模的時代,我們是否願意給「謹慎」和「責任」一點掌聲?
當我們最終迎來AGI的那一刻,我們會感謝今天Anthropic的「逆向操作」,還是會嘲笑他們的「保守」?
讓我們拭目以待。