WikiEdge:ArXiv-2404.19756/methods
跳至導覽
跳至搜尋
這篇論文的工作部分詳細介紹了如何開發和評估提出的Kolmogorov-Arnold Networks (KANs) 作為多層感知器 (MLPs) 的替代品。以下是這部分的主要內容:
- 理論啟發:
- 論文從Kolmogorov-Arnold 表示定理中獲得啟發,提出了KANs,這是一種新型的神經網絡,其特點是在網絡的邊緣(而非節點)上放置可學習的激活函數。
- 網絡架構:
- KANs的架構被設計為具有完全連接的結構,其中每個權重參數被一個作為樣條的一元函數所替代,從而實現了激活函數的可學習性。
- 模型簡化與解釋性:
- 論文提出了網絡簡化技術,包括稀疏化、可視化和剪枝,以提高KANs的解釋性,使其能夠與人類用戶直觀地交互。
- 準確性與神經縮放律:
- 科學發現中的應用:
- 論文通過數學和物理學中的兩個例子,展示了KANs作為科學家的「合作夥伴」在(重新)發現數學和物理定律方面的潛力。
- 代碼實現: