提升文本生成可靠性的鑰匙：糾正性檢索增強生成（CRAG）解讀

引言#

大語言模型在生成文字時，有時會產生虛假或錯誤的信息，這就像是 “幻覺”。雖然 RAG 技術可以通過從外部數據庫中獲取相關信息，幫助模型減少這些錯誤，但它很依賴於能否找到正確的信息。如果檢索到的文檔不夠準確，反而會讓生成的結果更加錯誤。
CRAG（糾正型檢索增強生成）就是為了解決這個問題而提出的。它引入了一種新的方法，通過一個 “檢索評估器” 來檢查找到的文檔是否可靠。如果文檔準確，就提取其中的重要信息；如果不準確，CRAG 還可以進一步通過網絡搜索找到更好的內容。這樣，它可以確保模型生成的文字更加可靠和準確。
CRAG 的特別之處在於，它不僅依賴於固定的數據庫，還可以通過網絡搜索獲取更多實時的信息。這使得即便初次檢索出現錯誤，CRAG 也能通過更廣泛的渠道找到正確答案，提升生成的準確性。

CRAG 的核心思想#

CRAG 的創新在於引入了一個檢索評估器，用於檢查從外部知識庫中檢索到的文檔是否與查詢相關。這個評估器幫助模型判斷檢索結果的質量，並根據不同情況做出相應的處理。

如果檢索結果準確，評估器會識別出其中最重要的部分，確保模型只使用對生成有幫助的內容。這樣可以避免模型陷入冗餘信息，保持生成內容的清晰和聚焦。
如果檢索結果不準確，評估器會觸發一個糾錯機制，啟動更大範圍的網絡搜索。這意味著模型不僅依賴於有限的知識庫，還可以從互聯網上獲取更多信息，從而提升生成的準確性。
如果評估器無法確定結果是否準確，它會採取折中策略，結合檢索到的內容和網絡搜索的結果，生成更可靠的回答。
CRAG 還採用了去粗取精的方法，對檢索到的文檔進行 “分解 - 重組”。這一步的作用是把冗長的文檔分成多個小段落，只保留與查詢高度相關的內容，去掉那些干擾信息，確保模型使用的信息是精煉且高效的。

CRAG 的技術流程#

在 CRAG 的流程中，檢索到的信息並不會直接用來生成答案，而是經過嚴格的篩選和處理，以確保更高的準確性。整個流程可以分為幾個步驟：

檢索評估器檢查文檔的準確性
每當用戶提出一個問題時，系統首先會從已有的知識庫中檢索相關的文檔。這時，CRAG 引入了一個 “檢索評估器”，它會對這些檢索到的文檔進行評分，判斷它們是否和問題直接相關。
- 相關的文檔：如果評估器認為文檔足夠相關，CRAG 會提取其中的關鍵內容，而不是把整個文檔都交給生成模型。
- 不相關的文檔：如果評估器判斷這些文檔和問題不符，它會直接拋棄這些文檔，並進行更廣泛的網絡搜索，以尋找更合適的信息來源。
- 模稜兩可的情況：如果評估器無法明確判斷文檔的相關性，那麼 CRAG 會選擇一種折中的方案，結合檢索到的文檔和外部搜索結果，一起用於生成答案。
去粗取精的文檔處理
對於被評估為相關的文檔，CRAG 不會把整個文檔都直接用來生成答案，而是通過 “分解 - 重組” 的方式處理。它會把文檔分成多個小段落，逐一評估每個段落是否對生成內容有幫助。那些無關或噪聲信息將被過濾，只留下關鍵段落。這一步的目的是確保生成的內容更加簡潔、準確。
動態調整生成策略
根據文檔評估的結果，CRAG 會動態調整生成過程。如果檢索結果非常可靠，系統只會依賴這些內部信息來生成答案；但如果檢索結果不理想，系統會通過外部的網絡搜索來補充知識，甚至在信息不確定時將兩者結合起來使用。這樣，生成內容的準確性和一致性得到了大大提高。

CRAG 的優勢#

CRAG 的設計靈活且容易應用。它是一種插件式方法，能夠輕鬆集成到現有的 RAG 框架中，而不需要對原有系統進行大幅度修改。換句話說，CRAG 可以直接增強現有的生成模型，讓它們在處理不準確信息時變得更加智能。
CRAG 還具備出色的魯棒性，特別是在遇到不相關或者錯誤檢索結果時。傳統的 RAG 方法往往會因為檢索到的無關信息而導致生成結果出現偏差，甚至產生錯誤的內容。而 CRAG 通過其檢索評估器和糾錯機制，能夠有效過濾掉這些噪聲信息，確保生成的內容更為可靠。此外，通過引入外部網頁搜索，CRAG 擴展了可獲取的信息源，即使在面對靜態知識庫有限的情況下，仍能找到合適的內容。
這種自我修正機制讓 CRAG 在各種生成任務中表現穩定，不論是短文本的回答還是長篇文本的生成，都能減少錯誤，提供更高質量的輸出。這種能力使得 CRAG 特別適用於需要高度準確性的場景，如事實陳述或問答任務。
這一切使 CRAG 成為在增強生成模型準確性方面的一個強有力工具，尤其是在面對不確定或潛在錯誤信息的情況下。

未來工作與局限性#

儘管 CRAG 提高了生成系統的可靠性，但仍有一些值得關注的挑戰。首先，CRAG 依賴於檢索評估器的準確性。如果評估器沒有正確判斷出文檔的相關性，系統仍可能生成不準確的信息。因此，未來的研究可以著重於如何進一步提升評估器的精度，以更好地篩選出有用的內容。
此外，CRAG 的一個重要環節是引入外部網頁搜索，尤其在檢索結果不夠相關時。這種方法雖然拓寬了信息來源，但也有引入噪聲或錯誤信息的風險，因為互聯網上的內容質量參差不齊。未來的改進可以考慮如何更有效地過濾網頁搜索結果，確保引入的外部信息足夠可靠。
最後，CRAG 雖然在多個任務中表現出色，但在特定領域（如高度專業化的醫學或法律文本生成）中，仍需驗證其適用性。因此，未來的研究可以針對不同領域進行更細致的優化，以確保在各種場景下都能保持高水平的生成質量。