WikiEdge:ArXiv-2407.15017/background

這篇文獻的背景主要集中在以下幾個方面：

大型語言模型（Large Language Models， LLMs）的知識機制理解：
- 知識是智能的基石，對於構建可信賴的通用人工智慧（Artificial General Intelligence， AGI）至關重要。大型語言模型因其在參數中蘊含豐富的知識而聞名，這些知識在應用中取得了前所未有的進展。
- 儘管LLMs在學習和應用知識方面取得了顯著成就，但它們在知識學習、存儲、利用和演化方面的機制仍然充滿神秘。
知識機制分析的新視角和分類：
- 本文提出了一種新的分類法，從知識利用和演化兩個維度分析知識機制，旨在全面理解LLMs在特定時期內的知識利用機制，以及知識在個體和群體LLMs中的動態進展。
- 通過分析，本文旨在揭示LLMs所學習的知識類型、參數知識脆弱性的原因，以及長期存在的潛在「暗知識」（未學習的知識）。
知識在LLMs中的表示和演化：
- 知識在LLMs中的表示和演化是構建更高效、更可信模型的關鍵。本文探討了如何通過知識機制的視角來構建更高效和可信的LLMs，包括知識編輯、模型合併等技術。
- 此外，本文還討論了LLMs在知識表示和利用方面的局限性，以及如何通過跨學科的視角來探索更多知識，從而推動LLMs向更高級別的智能發展。

綜上所述，這篇文獻的背景強調了在LLMs領域中對知識機制深入理解的需求，以及現有方法的局限性。作者提出了一種新的分析框架和分類法，旨在通過全面分析知識在LLMs中的生命周期，為未來的研究提供新的視角和啟示。

導覽選單