你最近是不是也有一種感覺——不管走到哪,大家都在聊AI,但聊著聊著,話題總會繞回同一個痛點:好貴。
不是普通的貴,是那種會讓你倒抽一口涼氣的貴。一台頂規的AI伺服器,動輒上千萬、甚至上億台幣,對多數企業來說,這根本不是「採購」,根本是「梭哈」。更殘酷的是,你花大錢買回來,發現自己的應用場景根本用不到那百分之百的算力,就像買了一台F1賽車卻只開去巷口買菜。
這種荒謬感,正是當下AI產業最真實的寫照。晶片漲、記憶體漲、伺服器整機漲,好像全世界都在跟你說:「沒錢?那你別玩AI了。」
但真的是這樣嗎?
在這一集的《思想實驗室》Podcast中,主持人知識長國威與安圖斯科技(Altos Computing)執行長李占傑進行了一場極具啟發的對談。他們聊的不是那些遙不可及的技術理論,而是一個正在發生的、務實到不行的商業模式革命——如何把一台天價的AI伺服器,像切蛋糕一樣「切」開來賣,讓算力不再是有錢人的專利。
如果你以為這只是老生常談的「雲端租用」概念,那你可就太小看這場變革了。接下來的內容,將從五個最反直覺、最讓你驚訝的視角,帶你重新看懂這場「算力平民化」運動的底層邏輯。
要點一:AI伺服器價格的「完美風暴」——不是漲價,是「價值重估」
你可能已經在新聞上看過,輝達(NVIDIA)的H100晶片價格從一顆30萬台幣飆到逼近百萬,但這只是冰山一角。真正讓企業主心驚膽跳的,是整台伺服器的總成本結構,已經發生了一場「完美風暴」。
李占傑在節目中毫不諱言地指出,現在一台標準的AI伺服器,成本結構已經完全扭曲。記憶體(HBM,高頻寬記憶體)和GPU晶片的價格漲幅,已經讓過去那種「買硬體、用三年」的折舊模型徹底失靈。
為什麼會這樣?因為AI的運算需求,本質上是在「暴力」地消耗記憶體頻寬。你餵給模型的資料越多、參數越大,它需要的記憶體就越多。這不是摩爾定律能解決的問題,這是物理學的瓶頸。當三星、SK海力士這些記憶體大廠發現,AI用的HBM記憶體利潤是傳統DRAM的好幾倍,它們當然會把產能全部轉過去。
結果就是:傳統伺服器的記憶體開始缺貨,AI伺服器的記憶體貴到離譜。
這不是一個短期的供需失衡,而是一個長期的「價值重估」。當整個產業鏈發現,AI運算的「瓶頸」不再是運算速度,而是資料傳輸與儲存的速度,那麼所有圍繞這個瓶頸的零組件,價格就會被重新定義。
這對投資人意味著什麼?你必須開始用「稀缺性」的眼光來看待這些零組件。 過去我們看伺服器,看的是CPU核心數、硬碟容量;現在我們看的,是HBM的容量與頻寬、是NVLink的傳輸速率。誰能掌握這些「稀缺資源」的供應,誰就能在這場漲價潮中立於不敗之地。
「現在的AI伺服器,成本結構已經完全扭曲。記憶體跟GPU的價格漲幅,已經讓過去那種『買硬體、用三年』的折舊模型徹底失靈。」——李占傑
這不是一個短期現象。這是AI基礎設施從「奢侈品」走向「必需品」的過程中,必然會經歷的陣痛。
要點二:別再買整台伺服器了——「算力切割」才是真正的大生意
如果一台伺服器貴到買不起,那怎麼辦?答案很簡單:不要買,用租的。
但這裡的「租」,不是像AWS或Google Cloud那樣,你按小時租一台虛擬機器。李占傑在節目中揭露了一個更精妙、更符合台灣產業需求的商業模式——「算力切割」。
想像一下,你是一家傳統製造業的IT主管。公司想要導入AI做瑕疵檢測,但算力需求可能只有一台頂規伺服器的10%。你不可能為了這10%的需求,去買一台100%的機器。過去,你只能選擇去跟雲端廠商租用,但雲端廠商的收費模式,往往包含大量的「網路傳輸費」和「平台手續費」,對於需要低延遲、高資料安全性的製造業來說,並不划算。
安圖斯科技的解法很直接:把一台實體的AI伺服器,透過虛擬化技術,切成好幾份「算力單元」來賣。 每一份算力單元,都配備了獨立的GPU、記憶體和儲存空間,彼此之間完全隔離。
這不是什麼新的虛擬機技術,而是專門為AI運算設計的硬體級隔離。因為AI訓練和推論的過程中,會大量佔用GPU的記憶體頻寬,如果只是用軟體層的虛擬化,很容易發生資源爭搶,導致效能雪崩式下降。安圖斯科技的作法,是從硬體底層就做好切割,確保每一個租戶都能獨享完整的運算資源。
這對誰最有用?答案是:中小企業(SME)。
台灣有超過95%的企業都是中小企業。它們不是不想導入AI,而是被高昂的硬體成本擋在門外。現在,它們可以用一個月幾萬塊、甚至幾千塊的價格,租到一台媲美大型企業等級的AI算力。這不是降級,這是賦能。
「我們把一台實體的AI伺服器,透過虛擬化技術,切成好幾份『算力單元』來賣。每一份算力單元,都配備了獨立的GPU、記憶體和儲存空間,彼此之間完全隔離。」——李占傑
這個商業模式的精髓在於:它同時解決了「成本」與「效率」兩個問題。 對供應商來說,一台高階伺服器的使用率可以從過去的30%提升到90%以上;對客戶來說,他們不用再為了那10%的需求,去承擔100%的資本支出。
要點三:台灣的「地緣政治紅利」——資料不出境,就是你的護城河
你可能會問:既然雲端服務這麼方便,為什麼不直接用AWS或Azure?原因很簡單:資料安全與法規。
李占傑在節目中點出了一個台灣企業獨有的痛點——資料不能出境。 特別是製造業、醫療業、金融業,這些高度監管的行業,它們的客戶資料、生產數據、病患資訊,往往受到嚴格的資料落地規範。如果使用國際雲端服務,資料必須經過海底電纜傳送到美國或新加坡的資料中心,這在法規上就是個大問題。
這正是台灣本土算力服務商的「地緣政治紅利」。當全球都在討論AI的「主權」問題時,台灣企業最在意的,是「我的資料,到底在哪裡?」
安圖斯科技提供的「算力切割」服務,可以部署在台灣本地的資料中心,甚至可以直接部署在客戶的機房裡。這意味著:資料從頭到尾都沒有離開過台灣的土地。 對於那些對資料安全極度敏感的企業來說,這比任何雲端服務都更有吸引力。
這也解釋了為什麼近期台灣的資料中心建置需求會如此火熱。不只是因為AI算力需求爆發,更是因為「資料主權」已經成為一個重要的決策變數。當各國政府開始對資料跨境傳輸設下更多限制,誰能在本地提供足夠的算力,誰就能抓住這波「在地化」的浪潮。
「台灣企業最在意的,是『我的資料,到底在哪裡?』。我們的服務可以部署在台灣本地的資料中心,甚至可以直接部署在客戶的機房裡。這意味著:資料從頭到尾都沒有離開過台灣的土地。」——李占傑
對投資人來說,這是一個值得深思的信號。未來能夠提供「在地算力」與「資料安全」雙重保證的公司,將會擁有極強的議價能力。 這不再只是技術問題,而是國家安全與商業競爭的綜合命題。
要點四:AI伺服器的「摩爾定律」已經失效——現在是「規模經濟」的時代
摩爾定律告訴我們,每18到24個月,晶片上的電晶體數量會翻倍,效能會提升、成本會下降。但這個定律,在AI伺服器領域,已經被打破了。
為什麼?因為AI模型的成長速度,遠遠超過了硬體效能的提升速度。李占傑在節目中舉了一個生動的例子:GPT-4的參數規模,是GPT-3的數十倍,但H100的運算效能,只比A100提升了不到三倍。
這意味著什麼?意味著你就算買了最新的GPU,你的模型訓練時間也不會因此縮短太多。真正的瓶頸,已經從「單一晶片的運算速度」,轉移到了「整個系統的數據吞吐量」。
這是一個非常反直覺的觀點。過去我們追求的是「更快的晶片」,現在我們追求的是「更多的晶片串聯」。AI伺服器不再是一台電腦,它變成了一個微型資料中心。 一台標準的AI伺服器,可能搭載了8顆GPU、數百GB的HBM記憶體、以及高速的NVLink互連架構。它的設計理念,是讓所有GPU像一個巨大的虛擬GPU一樣協同工作。
這也解釋了為什麼輝達的市值可以一度衝破三兆美元。因為它賣的不再是「晶片」,而是「算力集群」的解決方案。當你買了一台輝達的DGX伺服器,你買到的是一整套軟硬體整合的生態系,而不是一顆顆獨立的GPU。
但這也帶來了另一個問題:硬體的折舊速度極快。 一台AI伺服器的折舊年限,可能只有三到四年。這對大型雲端服務商來說還可以承受,但對一般企業來說,這簡直是噩夢。
「GPT-4的參數規模,是GPT-3的數十倍,但H100的運算效能,只比A100提升了不到三倍。真正的瓶頸,已經從『單一晶片的運算速度』,轉移到了『整個系統的數據吞吐量』。」——李占傑
這正是「算力切割」模式能夠成功的關鍵。它讓中小企業可以避開「硬體折舊」的陷阱,用「營運費用(OPEX)」取代「資本支出(CAPEX)」。當硬體的折舊速度比你的商業模式還快時,用租的絕對比用買的划算。
要點五:AI的「最後一哩路」——邊緣運算才是真正的決戰點
你可能已經注意到,現在所有的目光都集中在大型資料中心,集中在輝達的B200、AMD的MI300這些「怪獸級」晶片上。但李占傑在節目中提出了一個更重要的觀點:AI的決戰點,不在雲端,而在邊緣。
什麼是邊緣運算?簡單來說,就是讓AI模型在資料產生的地方就地運算,而不是把資料傳回雲端。這在製造業的自動光學檢測(AOI)、自駕車的即時決策、智慧零售的人臉辨識等場景中,至關重要。
為什麼邊緣運算這麼關鍵?因為延遲。如果一台自駕車要把所有感測器資料傳回雲端運算,再等結果傳回來,車子可能已經撞上了。同樣的道理,一條生產線上的瑕疵檢測,如果延遲超過幾毫秒,不良品就會流到下一個製程,造成更大的損失。
但邊緣運算面臨一個巨大的挑戰:算力限制。 邊緣裝置的體積、功耗、散熱條件都遠不如資料中心。你不可能在工廠的機台旁邊,放一台耗電數千瓦的AI伺服器。
這正是「算力切割」模式的另一個應用場景。李占傑透露,安圖斯科技正在開發一種**「邊緣AI伺服器」**,體積小、功耗低,但依然可以支援多租戶的算力切割。這意味著,一條生產線上的好幾台AOI設備,可以共享同一台邊緣伺服器的算力,彼此之間完全隔離,互不干擾。
「AI的決戰點,不在雲端,而在邊緣。一條生產線上的瑕疵檢測,如果延遲超過幾毫秒,不良品就會流到下一個製程,造成更大的損失。」——李占傑
這是一個極為重要的趨勢。當AI從「實驗室」走向「工廠」,從「聊天機器人」走向「實體世界」,邊緣運算的算力需求將會呈現指數級成長。 能夠在邊緣端提供高效、安全、低延遲的算力服務的公司,將會是下一波AI紅利的最大贏家。
核心觀點彙整
為了讓你更清楚地掌握這篇文章的核心觀點,這裡用表格做一個快速總結:
| 面向 | 傳統思維 | 新思維(算力切割) |
|---|---|---|
| 硬體成本 | 資本支出(CAPEX),一次砸大錢買整台伺服器 | 營運費用(OPEX),按月租用算力單元 |
| 使用效率 | 單一用戶,使用率常低於30% | 多租戶共享,使用率可達90%以上 |
| 適用對象 | 大型企業、雲端服務商 | 中小企業、製造業、醫療業 |
| 資料安全 | 資料可能需傳輸至海外雲端 | 資料本地運算,符合法規與安全需求 |
| 硬體折舊 | 3-4年快速折舊,技術迭代風險高 | 無折舊問題,供應商承擔技術風險 |
| 應用場景 | 以雲端訓練為主 | 兼顧雲端訓練與邊緣推論 |
總結:這是一場「算力民主化」的運動
聽完李占傑的分享,你應該有一種感覺:AI的門檻,正在被有系統地降低。
過去,AI是少數科技巨頭的遊戲。它們有錢買最好的硬體、有團隊訓練最大的模型。但現在,透過「算力切割」這個商業模式,一個只有五個人的新創團隊,也能用一個月幾萬塊的成本,訓練出媲美大公司的AI模型。
這不是什麼科幻情節,這是正在發生的事。
對於投資人來說,接下來的關注焦點應該從「誰在賣最貴的晶片」,轉移到「誰在提供最有效率的算力服務」。當輝達、AMD這些晶片巨頭在雲端打得火熱時,底層的「算力服務商」正在默默收割那些被忽略的長尾市場。
最後,留給你一個值得深思的問題:
當算力變得像水電一樣,可以隨開隨用、按量計費時,你認為哪一個產業,會因為這個「算力民主化」的趨勢,而發生最劇烈的顛覆?
答案,可能遠比你想像的更接近你的生活。