WikiEdge:ArXiv-2404.19756/methods

这篇论文的工作部分详细介绍了如何开发和评估提出的Kolmogorov-Arnold Networks (KANs) 作为多层感知器 (MLPs) 的替代品。以下是这部分的主要内容：

理论启发：
- 论文从Kolmogorov-Arnold 表示定理中获得启发，提出了KANs，这是一种新型的神经网络，其特点是在网络的边缘（而非节点）上放置可学习的激活函数。
网络架构：
- KANs的架构被设计为具有完全连接的结构，其中每个权重参数被一个作为样条的一元函数所替代，从而实现了激活函数的可学习性。
模型简化与解释性：
- 论文提出了网络简化技术，包括稀疏化、可视化和剪枝，以提高KANs的解释性，使其能够与人类用户直观地交互。
准确性与神经缩放律：
- 通过理论分析和实证实验，论文展示了KANs在小规模AI+科学任务上相较于MLPs在准确性和解释性方面的优势，并且KANs拥有比MLPs更快的神经缩放律。
科学发现中的应用：
- 论文通过数学和物理学中的两个例子，展示了KANs作为科学家的“合作伙伴”在（重新）发现数学和物理定律方面的潜力。
代码实现：
- 论文提供了实现KANs的代码，可通过GitHub访问，并可通过pip安装pykan包。

导航菜单