當AI像天才兒童一樣「卡住」時，你需要的不是更強的模型，而是「引導術」：揭開提示工程的真正威力

你是否曾對著ChatGPT、Claude或任何一款大型語言模型（LLM）輸入問題，卻得到一個平庸、錯誤，甚至完全離題的答案？然後你暗自心想：「這AI是不是不夠聰明？」或者，更糟的是，你開始懷疑自己花錢訂閱的頂級模型，其實名過其實。

但真相可能恰恰相反。問題往往不在模型，而在你。

台大電機系教授李宏毅在其最新的深度講座《Harness Engineering：有時候語言模型不是不夠聰明，只是沒有人類好好引導》中，提出了一個顛覆性的觀點：我們正處於一個典範轉移的關鍵點。AI的能力邊界，不再單純由模型的參數量或訓練數據決定，而是由人類「引導」與「提問」的藝術所重新定義。這不是關於下指令，而是關於開啟一場與超級智能的協作對話。

這門被稱為「提示工程」（Prompt Engineering）或更精準地說「駕馭工程」（Harness Engineering）的技藝，正在從工程師的秘技，轉變為每個知識工作者都必須掌握的「新母語」。它決定了你是能讓AI成為你的「十倍速生產力夥伴」，還是只是一個偶爾會出錯的昂貴聊天機器人。

準備好重新認識你手中的AI工具了嗎？以下，我們將深入剖析李宏毅教授講座中的核心要點，揭示如何從根本改變你與AI互動的方式，釋放那些被「鎖住」的驚人潛能。

要點一：從「提示工程」到「駕馭工程」：一場思維模式的根本革命

講座開宗明義，李宏毅教授首先釐清了一個關鍵概念：我們談論的不再是簡單的「提示」（Prompt），而是更全面的「駕馭」（Harness）。

「Harness Engineering 的核心精神是，我們不是給模型一個問題讓它去解，而是我們設計一個『過程』，讓模型在這個過程中，一步步展現出它的能力。」 —— 李宏毅

這是一個根本性的思維轉變。傳統上，我們習慣於「問題-答案」的線性模式：我問，你答。但大型語言模型的本質是一個基於機率分佈的「下一個詞預測器」。當你丟給它一個複雜問題時，它可能直接從知識庫中抽取一個最常見、但未必最正確或最深入的答案片段來回應。

「駕馭工程」則是把解題的「思考過程」本身，也變成提示的一部分。 你不再只是問「台灣的GDP是多少？」，而是引導AI：「我們要計算台灣的GDP影響力。首先，請你以經濟學家的角度，列出評估GDP影響力的三個關鍵維度。接著，針對台灣，蒐集每個維度近五年的關鍵數據。最後，綜合這些數據，給出一個分析報告，並指出主要的成長動力與潛在風險。」

這種方法強迫模型將其內部的「推理路徑」外顯化，而不是跳躍到一個未經深思的結論。這就像是要求一位天才兒童不僅要寫出數學題的答案，還要把計算紙上的每一步驟都展示給你看。在這個展示的過程中，錯誤更容易被發現，邏輯斷層更容易被補上，最終輸出的品質產生了質的飛躍。

這個典範的影響是深遠的。它意味著：

評估標準改變： 未來比較AI模型的優劣，不能只看最終答案的正確率，還要看它在良好引導下，展現出多麼清晰、連貫且可審計的推理能力。
技能門檻轉移： 最重要的技能從「知道答案」變成「知道如何問出能引出最佳答案的問題」。領域知識（Domain Knowledge）變得空前重要，因為只有懂行的人，才知道該設計什麼樣的「思考過程」來引導AI。
人機協作新模式： 人類的角色從「操作者」轉變為「引導者」或「教練」，負責設定框架、檢查邏輯、提供關鍵判斷；AI則負責執行繁重的資訊處理、模式匹配和草稿生成。

要點二：「思維鏈」與「思維樹」：讓AI的思考從「直覺」變成「演算」

在「駕馭工程」的實踐中，有兩個最具威力的具體技術：「思維鏈」（Chain-of-Thought, CoT）和它的進化版「思維樹」（Tree of Thoughts, ToT）。李宏毅教授在講座中花了相當篇幅解釋這兩者如何實際運作。

思維鏈（CoT） 的核心非常直白：在提示中，明確要求模型「逐步思考」。最簡單的觸發詞就是 「讓我們一步步思考」。

沒有CoT的提問： 「小明有5顆蘋果，他吃了2顆，又買了3顆，請問他現在有幾顆蘋果？」 AI可能直接輸出：「6顆。」（正確，但過程不明）
使用CoT的提問： 「小明有5顆蘋果，他吃了2顆，又買了3顆，請問他現在有幾顆蘋果？讓我們一步步思考。」 AI的輸出會變成：「首先，小明最初有5顆蘋果。他吃了2顆，所以剩下 5 - 2 = 3顆蘋果。然後，他又買了3顆，所以現在總共有 3 + 3 = 6顆蘋果。因此，小明現在有6顆蘋果。」

後者的輸出不僅給出答案，更展示了算術過程。對於簡單算術，差別不大。但對於複雜的邏輯推理、數學證明或需要多步驟規劃的問題，CoT能大幅提升模型表現。研究顯示，在諸如GSM8K（小學數學文字題）等基準測試上，加入CoT提示能讓大型模型的準確率提升超過20個百分點。

然而，CoT有一個潛在限制：它是一條單一的、線性的思考路徑。如果第一步的推理方向就錯了，整個鏈條可能會導向錯誤的答案。這引出了更強大的 「思維樹」（ToT）。

思維樹（ToT） 模仿了人類解決複雜問題時的做法：我們會考慮多種可能性，評估每條路徑，然後選擇最有希望的一條深入，必要時回溯（Backtrack）。 在ToT框架中，引導AI的過程如下：

思考生成： 針對當前問題，生成多個（例如，3-5個）可能的下一步推理方向或假設。
狀態評估： 對每一個生成的「思考」進行評估，用一個分數或評語判斷它有多接近最終目標。
搜尋（決策）： 根據評估結果，選擇最優的一條路徑繼續深入（類似深度優先搜尋），或者同時探索多條路徑（類似廣度優先搜尋）。
回溯與整合： 如果某條路徑走不通，則回到上一個決策點，嘗試其他選項，最終整合出最佳解決方案。

李宏毅教授以「24點遊戲」（用加減乘除使四個數字運算結果為24）為例，說明了ToT的強大。單純問GPT「(5, 5, 5, 1)怎麼算出24？」它可能給出錯誤或平庸的答案。但透過ToT引導，模型會系統性地嘗試 (5-1/5)*5 等多種組合，並評估每種組合的成功機率，最終有條理地找到正確解。

這項技術的商業應用潛力巨大：

策略規劃： 引導AI為新產品上市生成多個市場進入策略，評估每個策略的風險與回報，再合成最優方案。
創意發想： 在廣告文案或設計概念上，讓AI生成一個「創意樹」，從核心概念出發，衍生出多個風格迥異的分支，供人類選擇與深化。
複雜談判模擬： 模擬談判對手可能的多種反應路徑，並提前準備應對策略，實現動態的談判推演。

要點三：「自我批判」與「自我精煉」：讓AI成為自己的第一位評審

如果說CoT和ToT是為AI設計了思考的「骨架」，那麼「自我批判」（Self-Criticism）和「自我精煉」（Self-Refinement）就是賦予了AI「自我改進」的意識。這是李宏毅教授強調的另一個反直覺要點：與其我們人類去挑剔AI的錯誤，不如教會AI如何挑剔自己。

這通常透過多輪對話或結構化提示來實現。一個經典的模式是：

生成初始答案： 請AI回答一個複雜問題。
觸發批判模式： 接著要求AI「以嚴厲評審的身份，檢查你剛才給出的答案。找出其中可能的事實錯誤、邏輯漏洞、遺漏的關鍵點，或論述不清晰的地方。」
進行精煉修正： 最後指令AI「根據你剛才的批判，重新撰寫一個更準確、完整、清晰的答案。」

這個過程可以迭代多次，如同論文經過同儕審查後的反覆修改。李宏毅展示了一個例子：讓AI撰寫一段關於「量子計算對加密技術影響」的短文。初稿可能流於表面。經過一輪「自我批判」後，AI自己指出了「未提及具體的量子演算法（如Shor's Algorithm）」、「對時間軸的影響描述模糊」等問題。在第二輪的精煉中，產出的文章深度和精確度顯著提升。

這項技術的關鍵在於「角色分離」： 我們引導模型在「生成者」和「批判者」兩個角色之間切換。這規避了模型在單一回應中既要創造又要審查的內在矛盾。更進階的做法，甚至可以引入多個「專家角色」進行辯論，例如：「請一位資安專家批判這段文字，再請一位量子物理學家回應這些批判，最後由一位科技政策分析師總結共識與分歧。」

對於企業應用，這意味著：

自動化品質控制： 自動生成的報告、程式碼、行銷文案，可以先經過一輪AI自我審查，標記出潛在問題，再提交給人類，大幅減少人工校對負擔。
持續學習迴路： 結合使用者的反饋（如「這個答案不完整」），可以將反饋轉化為「批判提示」，讓模型在下次類似任務中自動應用精煉流程。
降低幻覺（Hallucination）風險： 透過強制性的自我事實核查步驟，可以減少AI捏造資訊的機率，提高輸出的可信度。

要點四：超越文字：結構化輸出與工具調用——將AI無縫接入工作流

高質量的思考過程，最終需要落地為高質量的輸出。而「高質量」在真實工作場景中，往往意味著「結構化」、「機器可讀」、「可立即行動」。李宏毅教授指出，引導AI輸出JSON、XML、特定格式的表格，或直接生成可執行的API調用指令，是將AI從「聊天玩具」升級為「生產力核心」的關鍵一步。

1. 結構化輸出（Structured Output）： 你不再滿足於AI給你一段自由發揮的文字。你需要的是可以直接導入資料庫、填入報表、或觸發下一個自動化流程的數據。

範例提示： 「分析以下三篇新聞稿的情感傾向（正面、負面、中性），並提取關鍵實體（公司名、人名、產品名）。請以JSON格式輸出，結構為：[{"id": 1, "sentiment": "...", "entities": [...]}, ...]」
價值： 這使得AI的輸出能與現有的軟體系統（CRM、ERP、BI工具）無縫對接，實現端到端的自動化。資料工程師不再需要手動解析AI生成的段落文字。

2. 工具調用（Tool Use / Function Calling）： 這是目前頂級LLM API（如OpenAI的GPT-4, Anthropic的Claude）的核心功能之一。你可以定義一系列「工具」（即函數），例如「搜尋網路」、「查詢資料庫」、「發送電子郵件」、「繪製圖表」，然後在對話中，引導AI在適當的時機「決定」調用哪個工具，並生成符合要求的調用參數。

運作流程： 人類定義工具清單 -> 用戶用自然語言提出需求（如「幫我找出台積電最近一季的營收，並和英特爾比較，做成一個趨勢圖」）-> AI分析需求，決定需調用「財經資料庫查詢API」兩次和「圖表生成API」一次 -> AI輸出結構化的函數調用請求 -> 後端系統執行這些函數，將結果返回給AI -> AI將結果組織成自然語言回覆給用戶。
價值： AI成為了整個數位系統的「自然語言介面」和大腦。 用戶無需知道背後有哪些系統、API怎麼呼叫，只需用說話的方式下達複雜指令，AI就能協調後端資源完成任務。這正是走向「AI智能體」（AI Agent）的基礎。

李宏毅強調，有效的引導必須包含對輸出格式的明確約束。這不僅是為了方便，更是為了訓練模型進行更精確的思考。當模型知道它需要產出一個結構嚴謹的JSON物件時，它會自動以更結構化的方式去組織內部的資訊提取與推理過程。

要點五：實戰框架與心法：從理論到實踐的引導清單

理解了核心概念後，如何實際操作？李宏毅教授在講座後半部，給出了一套可立即上手的實戰框架與心法，這不是隨機的提示詞技巧，而是有系統的方法論。

1. 引導設計框架：CRISP

Context（情境）： 首先為AI設定清晰的背景和角色。「你是一位擁有20年經驗的資深策略顧問，專精於科技產業。」
Request（請求）： 明確陳述核心任務。「請為一家新創的AI軟體公司起草一份進入日本市場的初步風險評估。」
Instructions（指示）： 給出具體的步驟、格式或限制。「請分為『市場風險』、『法規風險』、『競爭風險』三個部分論述，每個部分列出3點，並以表格形式呈現。」
Steps（步驟）： 對於複雜任務，分解步驟，鼓勵CoT。「第一步，請先列出日本AI軟體市場的前五大競爭者。第二步，分析我司產品與他們的差異化優勢與劣勢。第三步，基於前兩步，綜合評估競爭風險。」
Parameters（參數）： 設定輸出長度、風格、禁忌等。「輸出請控制在500字以內，風格專業但簡明，避免使用過度樂觀的形容詞。」

2. 迭代優化心法：觀察、診斷、調整

觀察輸出： AI的錯誤或平庸輸出，是優化提示的最佳素材。不要輕易放棄，仔細看它「錯在哪裡」。
診斷根源： 是缺乏上下文？步驟太跳躍？角色設定不清？還是需要引入外部知識（檢索）？
調整提示： 針對診斷結果，精準地增、刪、改你的提示。例如，如果AI忽略了最新數據，就在提示中加入「請基於2025年以來的數據進行分析」或引入網路搜尋工具。

3. 高階技巧融合：

「少樣本學習」提示： 在提示中提供1-3個高品質的輸入輸出範例，讓模型快速掌握你的特定格式和風格要求。
「自動化提示工程」： 使用另一個AI模型（或同一模型的不同執行緒）來幫你優化提示。你可以問：「我想讓GPT-4幫我生成產品描述，這是我的初始提示，如何修改能讓輸出更具說服力且包含關鍵字？」
「元認知」提示： 引導AI解釋它自己的思考過程，這不僅有助於輸出，更能讓你理解模型的「思維方式」，建立更有效的合作關係。

核心觀點與技術對照表

技術/概念	核心思想	關鍵手法	主要應用場景	對人類角色的影響
思維鏈 (CoT)	將思考過程外顯化，避免跳躍式結論。	在提示中加入「逐步思考」、「讓我們一步步來」等指令。	數學解題、邏輯推理、多步驟規劃、解釋性回答。	從「答案審核者」變為「過程監督者」，能更早介入糾偏。
思維樹 (ToT)	模擬人類的多路徑探索與決策過程。	引導AI生成多個思考方向，評估後選擇最優路徑深入或整合。	複雜策略規劃、創意發散與收斂、遊戲求解、談判模擬。	成為「策略導航員」，設定探索框架與評估標準，而非微管理。
自我批判與精煉	教導AI進行自我評估與迭代改進。	設計多輪對話，讓AI交替扮演「生成者」與「批判者」角色。	高質量內容創作（報告、論文、程式碼）、事實核查、降低幻覺。	從「修改者」提升為「主編」或「教練」，聚焦於高層次的指導與標準制定。
結構化輸出	使AI輸出機器可讀、可立即行動的格式。	在提示中明確指定輸出格式（JSON, XML, Markdown表格等）。	數據提取與整理、報表自動生成、系統整合、自動化流程觸發。	從「資訊消費者」轉為「流程設計師」，專注於設計端到端的自動化工作流。
工具調用	讓AI成為協調數位工具與服務的智能介面。	定義工具函數，引導AI在推理中決定何時及如何調用工具。	個人智能助理、企業級自動化Agent、跨系統複雜任務執行。	成為「產品經理」或「架構師」，定義AI可調用的能力邊界與協作協議。

結論：你準備好成為AI時代的「引導者」了嗎？

李宏毅教授這場長達92分鐘的講座，與其說是在教授一項名為「提示工程」的技能，不如說是在描繪一幅人機協作新紀元的藍圖。未來的分水嶺，將不在於誰能訪問最強大的模型，而在於誰能最有效地「駕馭」它。

這項能力將迅速從技術專家的領域，擴散到每一個產業：律師需要駕馭AI進行案例研究與合同審閱；醫生需要引導AI分析病歷與文獻；教師需要設計提示來創建個性化教案；行銷人員需要透過AI模擬市場活動的多重結果。「引導力」將成為與「專業力」並駕齊驅的核心職能。

這也意味著，對企業而言，最大的投資不應只放在購買最昂貴的AI API授權上，更應放在培育組織內部的「引導」文化與能力。建立內部的最佳提示庫、舉辦工作坊、讓最擅長與AI協作的員工分享心法，這些「軟性投資」的回報率，可能遠超單純的硬體或軟體採購。

最後，留給我們一個值得深思的問題：當AI在我們的引導下，展現出越來越接近、甚至超越人類特定領域的推理與創造能力時，我們人類獨特的價值，究竟會更牢固地錨定在何處？ 是提出第一個原創問題的靈光？是定義價值與倫理框架的判斷？還是那份在不確定性中，依然敢於引導一個強大而不完全可控的智慧體，共同探索未知的勇氣？

答案，或許就藏在每一次你與AI對話時，所鍵入的那段精心設計的提示詞之中。你，不僅是在提問，更是在塑造未來協作的樣貌。