如何讓大語言模型成為更聰明的決策者：深入淺出PlanRAG技術

引言：讓計算機做決策？#

近年來，我們經常聽到 “人工智慧” 這個詞，特別是當我們談論像聊天機器人或自動翻譯工具時。但你有沒有想過，計算機能否像人類一樣做出複雜的決策？比如，公司該在哪個城市建新工廠，或商家應該如何調整庫存來節省成本。這些問題通常需要我們分析大量數據，並根據具體情況做出決定。
今天，許多大語言模型（LLM）已經非常擅長回答問題，比如問它們天氣怎麼樣，或者幫忙總結一篇文章的要點。但當面對需要深度思考和多步驟決策的問題時，它們就力不從心了。大部分情況下，它們只能根據查詢到的信息直接給出答案，無法像人類那樣 “思考” 接下來的分析步驟。這就是我們今天要聊的 PlanRAG 技術，它的設計目標是幫助這些模型不僅能回答問題，還能像一個聰明的決策者那樣一步步進行數據分析。
PlanRAG 的創新在於，它不僅依靠語言模型來檢索和回答問題，還讓模型學會在回答問題之前先做 “計劃”，就像我們做決定前需要思考 “我接下來該查什麼數據” 一樣。這種先計劃、再檢索的思維方式，使得模型在面對複雜決策問題時能更好地應對。
接下來，我們會深入探討 PlanRAG 是如何工作的，以及它能為我們帶來哪些實際應用。

什麼是 PlanRAG？#

想像一下，你要解決一個複雜的問題，比如決定如何規劃一家工廠的生產流程。你不會盲目地開始操作，而是先計劃步驟，明確需要哪些信息，接著再去搜集數據，最後根據分析結果做出決策。PlanRAG 就是這樣一套類似的系統，不過它應用在大語言模型（LLM）上，讓它們能在解決複雜問題時 “先計劃，再執行”。
通常，大語言模型通過一種叫做 “檢索增強生成（RAG）” 的技術工作，直接從外部獲取相關數據，然後生成答案。然而，PlanRAG 比傳統方法更進一步：它不僅僅是簡單地檢索和生成，而是先讓模型為整個問題制定一個初步的計劃，明確需要哪些信息和步驟，然後再根據計劃提出問題並獲取數據。如果獲取的數據不足以解答問題，模型會重新調整計劃，繼續查詢數據，直到能做出決策。
舉個例子，想像在一個模擬商業環境的遊戲中，你扮演一個商人，需要決定在哪個城市設置一個商貿點來最大化你的利潤。PlanRAG 的第一步是為這個問題創建一個計劃，比如確定要從哪些貿易節點獲取數據，然後生成查詢來收集這些節點的利潤數據。接著，模型會根據這些數據來分析哪個節點最有利，並做出最後的選擇。
PlanRAG 的特別之處在於，它不僅僅是檢索數據，它會反覆思考、調整策略，直到找到最佳方案。這種規劃與檢索相結合的方法，大大提升了模型在複雜決策中的表現。

關鍵問題：決策問答（Decision QA）#

在很多實際場景中，決策並不總是簡單的。無論是企業管理、物流規劃，還是日常生活中的複雜選擇，通常需要大量數據分析才能找到最優的解決方案。決策問答（Decision QA）就是 PlanRAG 論文中提出的概念，專門解決這種複雜的決策問題。
舉個例子，想像一下你在玩一個模擬經營的遊戲，比如《維多利亞 3》或《歐陸風雲 4》。在遊戲裡，你需要做出一些重要的決策，比如應該把商人派往哪個城市，以此增加貿易利潤，或者如何在工廠裡最合理地分配資源，降低成本。要做出這些決策，你需要先了解各種數據，比如每個城市的經濟發展狀況、貿易流量，甚至是其他國家的影響。
決策問答正是用來幫助解決這類問題的。模型不僅要回答像 “我該把商人派到哪裡？” 這樣的簡單問題，還需要考慮背後的數據和規則，比如各個城市的經濟狀況、相鄰國家的影響等。這和一般的問答系統不一樣，普通的系統只是基於問題檢索答案，而決策問答需要模型進行深度思考和數據分析，才能做出最優決策。
決策問答的難度在於它不僅僅是一個簡單的選擇題，而是一個需要深入理解數據、規則、背景信息的複雜決策過程。PlanRAG 通過規劃、檢索和迭代調整，幫助模型在這些複雜場景中做出更好的選擇。

PlanRAG 的核心步驟#

PlanRAG 之所以獨特，是因為它讓大語言模型不僅僅依賴於簡單的數據查詢，而是通過一步步的規劃和迭代，解決複雜的決策問題。整個過程可以分為三個關鍵步驟：規劃、數據檢索、和重新規劃。

1. 規劃：模型如何生成一個計劃#

當我們面對一個複雜問題時，通常要先弄清楚需要什麼信息來做出決定。PlanRAG 的模型也是這樣，它會先根據問題生成一個計劃，這個計劃列出哪些數據需要被檢索。這一步很像你在購物前列購物清單 —— 你不會直接去超市，而是先考慮自己需要買什麼。
舉個例子，如果一個模型需要幫助一家公司決定在哪個市場擴展，它可能會計劃先查詢各個市場的競爭情況和潛在利潤。

2. 數據檢索：根據計劃提問並獲取數據#

有了明確的計劃，模型接下來會根據這個計劃向數據庫提問，檢索出相關的數據。這就好比你帶著購物清單去超市，找到你需要的物品。在這個過程中，模型會生成相應的查詢，獲取能夠幫助它做決策的信息。
比如在決策商人放在哪裡最能賺錢的例子中，模型會查找各個市場的交易流量和每個市場的潛在利潤，看看把商人放在哪個位置收益最大。

3. 重新規劃：分析後進一步調整計劃#

有時候，最初的計劃並不完美，檢索到的數據可能無法完全解決問題。在這種情況下，PlanRAG 模型會停下來，重新審視已經獲取的數據，並決定是否需要調整計劃。這就像你發現購物清單上忘了寫某個必需品，於是回頭再添加並繼續找。
這個重新規劃的過程非常重要，因為它確保模型在面對複雜問題時，可以靈活地調整自己的分析方式，直到找到最優的解決方案。

與其他方法的對比：為什麼 PlanRAG 更勝一籌？#

為了理解 PlanRAG 的優勢，我們可以先看看它是如何不同於其他常見方法的。以往的方法，比如迭代檢索增強生成（Iterative RAG），主要依賴於模型一次又一次地檢索信息，然後基於這些檢索結果生成答案。這種方法在處理簡單的知識問答問題時非常有效，因為它專注於找到與問題直接相關的信息。
但問題來了，面對更複雜的決策場景，比如根據多種數據點做出一系列分析和判斷時，傳統方法往往力不從心。Iterative RAG 並不擅長處理需要多個步驟、涉及計劃和數據推理的任務。例如，在遊戲場景中選擇最佳的貿易節點時，模型不僅要找到與節點相關的所有信息，還需要綜合分析這些信息來做出正確的決策。而現有方法在這個過程中，容易只找到單個信息片段，卻忽略了對整體的分析和規劃。
PlanRAG 的突破點在於它首先要求模型 “先做計劃”。模型會先規劃出需要檢索哪些數據，如何分析這些數據，這樣可以避免模型胡亂地搜索信息。再通過反覆的計劃、檢索、調整，模型能逐步完善自己的決策過程。這意味著 PlanRAG 更有條理，也更有效率，尤其是在那些需要深入理解多個數據片段的複雜任務中。
通過實驗，PlanRAG 在 “決策問答” 中的表現比 Iterative RAG 有了顯著提升。在 “定位” 場景中，PlanRAG 提升了 15.8% 的準確率，而在 “建造” 場景中也提高了 7.4%。這些數字展示了它在複雜任務中的優越性。具體來說，PlanRAG 不僅能夠找到關鍵數據，還能合理規劃整個決策過程，從而大幅提高決策的準確性。
簡單來說，PlanRAG 像一個更細緻的決策者，它不僅會問問題，還會思考自己該問哪些問題，並根據回答不斷修正方向，這使得它在複雜的決策場景中表現更好。