比特思想實驗室
財經創業成長AI ToolsAbout Me
比特思想實驗室
© 2026
首頁AI Tools@HungyiLeeNTU當AI像天才兒童一樣「卡住」時,你需要的不是更強的模型,而是「引導術」:揭開提示工程的真正威力

當AI像天才兒童一樣「卡住」時,你需要的不是更強的模型,而是「引導術」:揭開提示工程的真正威力

AI Tools@HungyiLeeNTU2026年4月13日14 分鐘閱讀
提示工程李宏毅大型語言模型思維鏈人工智慧應用

當AI像天才兒童一樣「卡住」時,你需要的不是更強的模型,而是「引導術」:揭開提示工程的真正威力

你是否曾對著ChatGPT、Claude或任何一款大型語言模型(LLM)輸入問題,卻得到一個平庸、錯誤,甚至完全離題的答案?然後你暗自心想:「這AI是不是不夠聰明?」或者,更糟的是,你開始懷疑自己花錢訂閱的頂級模型,其實名過其實。

但真相可能恰恰相反。問題往往不在模型,而在你。

台大電機系教授李宏毅在其最新的深度講座《Harness Engineering:有時候語言模型不是不夠聰明,只是沒有人類好好引導》中,提出了一個顛覆性的觀點:我們正處於一個典範轉移的關鍵點。AI的能力邊界,不再單純由模型的參數量或訓練數據決定,而是由人類「引導」與「提問」的藝術所重新定義。這不是關於下指令,而是關於開啟一場與超級智能的協作對話。

這門被稱為「提示工程」(Prompt Engineering)或更精準地說「駕馭工程」(Harness Engineering)的技藝,正在從工程師的秘技,轉變為每個知識工作者都必須掌握的「新母語」。它決定了你是能讓AI成為你的「十倍速生產力夥伴」,還是只是一個偶爾會出錯的昂貴聊天機器人。

準備好重新認識你手中的AI工具了嗎?以下,我們將深入剖析李宏毅教授講座中的核心要點,揭示如何從根本改變你與AI互動的方式,釋放那些被「鎖住」的驚人潛能。


要點一:從「提示工程」到「駕馭工程」:一場思維模式的根本革命

講座開宗明義,李宏毅教授首先釐清了一個關鍵概念:我們談論的不再是簡單的「提示」(Prompt),而是更全面的「駕馭」(Harness)。

「Harness Engineering 的核心精神是,我們不是給模型一個問題讓它去解,而是我們設計一個『過程』,讓模型在這個過程中,一步步展現出它的能力。」 —— 李宏毅

這是一個根本性的思維轉變。傳統上,我們習慣於「問題-答案」的線性模式:我問,你答。但大型語言模型的本質是一個基於機率分佈的「下一個詞預測器」。當你丟給它一個複雜問題時,它可能直接從知識庫中抽取一個最常見、但未必最正確或最深入的答案片段來回應。

「駕馭工程」則是把解題的「思考過程」本身,也變成提示的一部分。 你不再只是問「台灣的GDP是多少?」,而是引導AI:「我們要計算台灣的GDP影響力。首先,請你以經濟學家的角度,列出評估GDP影響力的三個關鍵維度。接著,針對台灣,蒐集每個維度近五年的關鍵數據。最後,綜合這些數據,給出一個分析報告,並指出主要的成長動力與潛在風險。」

這種方法強迫模型將其內部的「推理路徑」外顯化,而不是跳躍到一個未經深思的結論。這就像是要求一位天才兒童不僅要寫出數學題的答案,還要把計算紙上的每一步驟都展示給你看。在這個展示的過程中,錯誤更容易被發現,邏輯斷層更容易被補上,最終輸出的品質產生了質的飛躍。

這個典範的影響是深遠的。它意味著:

  • 評估標準改變: 未來比較AI模型的優劣,不能只看最終答案的正確率,還要看它在良好引導下,展現出多麼清晰、連貫且可審計的推理能力。
  • 技能門檻轉移: 最重要的技能從「知道答案」變成「知道如何問出能引出最佳答案的問題」。領域知識(Domain Knowledge)變得空前重要,因為只有懂行的人,才知道該設計什麼樣的「思考過程」來引導AI。
  • 人機協作新模式: 人類的角色從「操作者」轉變為「引導者」或「教練」,負責設定框架、檢查邏輯、提供關鍵判斷;AI則負責執行繁重的資訊處理、模式匹配和草稿生成。

要點二:「思維鏈」與「思維樹」:讓AI的思考從「直覺」變成「演算」

在「駕馭工程」的實踐中,有兩個最具威力的具體技術:「思維鏈」(Chain-of-Thought, CoT)和它的進化版「思維樹」(Tree of Thoughts, ToT)。李宏毅教授在講座中花了相當篇幅解釋這兩者如何實際運作。

思維鏈(CoT) 的核心非常直白:在提示中,明確要求模型「逐步思考」。最簡單的觸發詞就是 「讓我們一步步思考」。

  • 沒有CoT的提問: 「小明有5顆蘋果,他吃了2顆,又買了3顆,請問他現在有幾顆蘋果?」 AI可能直接輸出:「6顆。」(正確,但過程不明)
  • 使用CoT的提問: 「小明有5顆蘋果,他吃了2顆,又買了3顆,請問他現在有幾顆蘋果?讓我們一步步思考。」 AI的輸出會變成:「首先,小明最初有5顆蘋果。他吃了2顆,所以剩下 5 - 2 = 3顆蘋果。然後,他又買了3顆,所以現在總共有 3 + 3 = 6顆蘋果。因此,小明現在有6顆蘋果。」

後者的輸出不僅給出答案,更展示了算術過程。對於簡單算術,差別不大。但對於複雜的邏輯推理、數學證明或需要多步驟規劃的問題,CoT能大幅提升模型表現。研究顯示,在諸如GSM8K(小學數學文字題)等基準測試上,加入CoT提示能讓大型模型的準確率提升超過20個百分點。

然而,CoT有一個潛在限制:它是一條單一的、線性的思考路徑。如果第一步的推理方向就錯了,整個鏈條可能會導向錯誤的答案。這引出了更強大的 「思維樹」(ToT)。

思維樹(ToT) 模仿了人類解決複雜問題時的做法:我們會考慮多種可能性,評估每條路徑,然後選擇最有希望的一條深入,必要時回溯(Backtrack)。 在ToT框架中,引導AI的過程如下:

  1. 思考生成: 針對當前問題,生成多個(例如,3-5個)可能的下一步推理方向或假設。
  2. 狀態評估: 對每一個生成的「思考」進行評估,用一個分數或評語判斷它有多接近最終目標。
  3. 搜尋(決策): 根據評估結果,選擇最優的一條路徑繼續深入(類似深度優先搜尋),或者同時探索多條路徑(類似廣度優先搜尋)。
  4. 回溯與整合: 如果某條路徑走不通,則回到上一個決策點,嘗試其他選項,最終整合出最佳解決方案。

李宏毅教授以「24點遊戲」(用加減乘除使四個數字運算結果為24)為例,說明了ToT的強大。單純問GPT「(5, 5, 5, 1)怎麼算出24?」它可能給出錯誤或平庸的答案。但透過ToT引導,模型會系統性地嘗試 (5-1/5)*5 等多種組合,並評估每種組合的成功機率,最終有條理地找到正確解。

這項技術的商業應用潛力巨大:

  • 策略規劃: 引導AI為新產品上市生成多個市場進入策略,評估每個策略的風險與回報,再合成最優方案。
  • 創意發想: 在廣告文案或設計概念上,讓AI生成一個「創意樹」,從核心概念出發,衍生出多個風格迥異的分支,供人類選擇與深化。
  • 複雜談判模擬: 模擬談判對手可能的多種反應路徑,並提前準備應對策略,實現動態的談判推演。

要點三:「自我批判」與「自我精煉」:讓AI成為自己的第一位評審

如果說CoT和ToT是為AI設計了思考的「骨架」,那麼「自我批判」(Self-Criticism)和「自我精煉」(Self-Refinement)就是賦予了AI「自我改進」的意識。這是李宏毅教授強調的另一個反直覺要點:與其我們人類去挑剔AI的錯誤,不如教會AI如何挑剔自己。

這通常透過多輪對話或結構化提示來實現。一個經典的模式是:

  1. 生成初始答案: 請AI回答一個複雜問題。
  2. 觸發批判模式: 接著要求AI「以嚴厲評審的身份,檢查你剛才給出的答案。找出其中可能的事實錯誤、邏輯漏洞、遺漏的關鍵點,或論述不清晰的地方。」
  3. 進行精煉修正: 最後指令AI「根據你剛才的批判,重新撰寫一個更準確、完整、清晰的答案。」

這個過程可以迭代多次,如同論文經過同儕審查後的反覆修改。李宏毅展示了一個例子:讓AI撰寫一段關於「量子計算對加密技術影響」的短文。初稿可能流於表面。經過一輪「自我批判」後,AI自己指出了「未提及具體的量子演算法(如Shor's Algorithm)」、「對時間軸的影響描述模糊」等問題。在第二輪的精煉中,產出的文章深度和精確度顯著提升。

這項技術的關鍵在於「角色分離」: 我們引導模型在「生成者」和「批判者」兩個角色之間切換。這規避了模型在單一回應中既要創造又要審查的內在矛盾。更進階的做法,甚至可以引入多個「專家角色」進行辯論,例如:「請一位資安專家批判這段文字,再請一位量子物理學家回應這些批判,最後由一位科技政策分析師總結共識與分歧。」

對於企業應用,這意味著:

  • 自動化品質控制: 自動生成的報告、程式碼、行銷文案,可以先經過一輪AI自我審查,標記出潛在問題,再提交給人類,大幅減少人工校對負擔。
  • 持續學習迴路: 結合使用者的反饋(如「這個答案不完整」),可以將反饋轉化為「批判提示」,讓模型在下次類似任務中自動應用精煉流程。
  • 降低幻覺(Hallucination)風險: 透過強制性的自我事實核查步驟,可以減少AI捏造資訊的機率,提高輸出的可信度。

要點四:超越文字:結構化輸出與工具調用——將AI無縫接入工作流

高質量的思考過程,最終需要落地為高質量的輸出。而「高質量」在真實工作場景中,往往意味著「結構化」、「機器可讀」、「可立即行動」。李宏毅教授指出,引導AI輸出JSON、XML、特定格式的表格,或直接生成可執行的API調用指令,是將AI從「聊天玩具」升級為「生產力核心」的關鍵一步。

1. 結構化輸出(Structured Output): 你不再滿足於AI給你一段自由發揮的文字。你需要的是可以直接導入資料庫、填入報表、或觸發下一個自動化流程的數據。

  • 範例提示: 「分析以下三篇新聞稿的情感傾向(正面、負面、中性),並提取關鍵實體(公司名、人名、產品名)。請以JSON格式輸出,結構為:[{"id": 1, "sentiment": "...", "entities": [...]}, ...]」
  • 價值: 這使得AI的輸出能與現有的軟體系統(CRM、ERP、BI工具)無縫對接,實現端到端的自動化。資料工程師不再需要手動解析AI生成的段落文字。

2. 工具調用(Tool Use / Function Calling): 這是目前頂級LLM API(如OpenAI的GPT-4, Anthropic的Claude)的核心功能之一。你可以定義一系列「工具」(即函數),例如「搜尋網路」、「查詢資料庫」、「發送電子郵件」、「繪製圖表」,然後在對話中,引導AI在適當的時機「決定」調用哪個工具,並生成符合要求的調用參數。

  • 運作流程: 人類定義工具清單 -> 用戶用自然語言提出需求(如「幫我找出台積電最近一季的營收,並和英特爾比較,做成一個趨勢圖」)-> AI分析需求,決定需調用「財經資料庫查詢API」兩次和「圖表生成API」一次 -> AI輸出結構化的函數調用請求 -> 後端系統執行這些函數,將結果返回給AI -> AI將結果組織成自然語言回覆給用戶。
  • 價值: AI成為了整個數位系統的「自然語言介面」和大腦。 用戶無需知道背後有哪些系統、API怎麼呼叫,只需用說話的方式下達複雜指令,AI就能協調後端資源完成任務。這正是走向「AI智能體」(AI Agent)的基礎。

李宏毅強調,有效的引導必須包含對輸出格式的明確約束。這不僅是為了方便,更是為了訓練模型進行更精確的思考。當模型知道它需要產出一個結構嚴謹的JSON物件時,它會自動以更結構化的方式去組織內部的資訊提取與推理過程。

要點五:實戰框架與心法:從理論到實踐的引導清單

理解了核心概念後,如何實際操作?李宏毅教授在講座後半部,給出了一套可立即上手的實戰框架與心法,這不是隨機的提示詞技巧,而是有系統的方法論。

1. 引導設計框架:CRISP

  • Context(情境): 首先為AI設定清晰的背景和角色。「你是一位擁有20年經驗的資深策略顧問,專精於科技產業。」
  • Request(請求): 明確陳述核心任務。「請為一家新創的AI軟體公司起草一份進入日本市場的初步風險評估。」
  • Instructions(指示): 給出具體的步驟、格式或限制。「請分為『市場風險』、『法規風險』、『競爭風險』三個部分論述,每個部分列出3點,並以表格形式呈現。」
  • Steps(步驟): 對於複雜任務,分解步驟,鼓勵CoT。「第一步,請先列出日本AI軟體市場的前五大競爭者。第二步,分析我司產品與他們的差異化優勢與劣勢。第三步,基於前兩步,綜合評估競爭風險。」
  • Parameters(參數): 設定輸出長度、風格、禁忌等。「輸出請控制在500字以內,風格專業但簡明,避免使用過度樂觀的形容詞。」

2. 迭代優化心法:觀察、診斷、調整

  • 觀察輸出: AI的錯誤或平庸輸出,是優化提示的最佳素材。不要輕易放棄,仔細看它「錯在哪裡」。
  • 診斷根源: 是缺乏上下文?步驟太跳躍?角色設定不清?還是需要引入外部知識(檢索)?
  • 調整提示: 針對診斷結果,精準地增、刪、改你的提示。例如,如果AI忽略了最新數據,就在提示中加入「請基於2025年以來的數據進行分析」或引入網路搜尋工具。

3. 高階技巧融合:

  • 「少樣本學習」提示: 在提示中提供1-3個高品質的輸入輸出範例,讓模型快速掌握你的特定格式和風格要求。
  • 「自動化提示工程」: 使用另一個AI模型(或同一模型的不同執行緒)來幫你優化提示。你可以問:「我想讓GPT-4幫我生成產品描述,這是我的初始提示,如何修改能讓輸出更具說服力且包含關鍵字?」
  • 「元認知」提示: 引導AI解釋它自己的思考過程,這不僅有助於輸出,更能讓你理解模型的「思維方式」,建立更有效的合作關係。

核心觀點與技術對照表

技術/概念核心思想關鍵手法主要應用場景對人類角色的影響
思維鏈 (CoT)將思考過程外顯化,避免跳躍式結論。在提示中加入「逐步思考」、「讓我們一步步來」等指令。數學解題、邏輯推理、多步驟規劃、解釋性回答。從「答案審核者」變為「過程監督者」,能更早介入糾偏。
思維樹 (ToT)模擬人類的多路徑探索與決策過程。引導AI生成多個思考方向,評估後選擇最優路徑深入或整合。複雜策略規劃、創意發散與收斂、遊戲求解、談判模擬。成為「策略導航員」,設定探索框架與評估標準,而非微管理。
自我批判與精煉教導AI進行自我評估與迭代改進。設計多輪對話,讓AI交替扮演「生成者」與「批判者」角色。高質量內容創作(報告、論文、程式碼)、事實核查、降低幻覺。從「修改者」提升為「主編」或「教練」,聚焦於高層次的指導與標準制定。
結構化輸出使AI輸出機器可讀、可立即行動的格式。在提示中明確指定輸出格式(JSON, XML, Markdown表格等)。數據提取與整理、報表自動生成、系統整合、自動化流程觸發。從「資訊消費者」轉為「流程設計師」,專注於設計端到端的自動化工作流。
工具調用讓AI成為協調數位工具與服務的智能介面。定義工具函數,引導AI在推理中決定何時及如何調用工具。個人智能助理、企業級自動化Agent、跨系統複雜任務執行。成為「產品經理」或「架構師」,定義AI可調用的能力邊界與協作協議。

結論:你準備好成為AI時代的「引導者」了嗎?

李宏毅教授這場長達92分鐘的講座,與其說是在教授一項名為「提示工程」的技能,不如說是在描繪一幅人機協作新紀元的藍圖。未來的分水嶺,將不在於誰能訪問最強大的模型,而在於誰能最有效地「駕馭」它。

這項能力將迅速從技術專家的領域,擴散到每一個產業:律師需要駕馭AI進行案例研究與合同審閱;醫生需要引導AI分析病歷與文獻;教師需要設計提示來創建個性化教案;行銷人員需要透過AI模擬市場活動的多重結果。「引導力」將成為與「專業力」並駕齊驅的核心職能。

這也意味著,對企業而言,最大的投資不應只放在購買最昂貴的AI API授權上,更應放在培育組織內部的「引導」文化與能力。建立內部的最佳提示庫、舉辦工作坊、讓最擅長與AI協作的員工分享心法,這些「軟性投資」的回報率,可能遠超單純的硬體或軟體採購。

最後,留給我們一個值得深思的問題:當AI在我們的引導下,展現出越來越接近、甚至超越人類特定領域的推理與創造能力時,我們人類獨特的價值,究竟會更牢固地錨定在何處? 是提出第一個原創問題的靈光?是定義價值與倫理框架的判斷?還是那份在不確定性中,依然敢於引導一個強大而不完全可控的智慧體,共同探索未知的勇氣?

答案,或許就藏在每一次你與AI對話時,所鍵入的那段精心設計的提示詞之中。你,不僅是在提問,更是在塑造未來協作的樣貌。

上一篇

告別單打獨鬥:用 OpenClaw 與 Hermes 組建你的 AI 特工隊,效率革命正在發生

下一篇

Figma CEO 親授:AI時代,設計師如何不被淘汰?Dylan Field 揭示「人機協作」的殘酷真相

目錄

目錄

中