WikiEdge:ArXiv-2404.19756/methods
跳转到导航
跳转到搜索
这篇论文的工作部分详细介绍了如何开发和评估提出的Kolmogorov-Arnold Networks (KANs) 作为多层感知器 (MLPs) 的替代品。以下是这部分的主要内容:
- 理论启发:
- 论文从Kolmogorov-Arnold 表示定理中获得启发,提出了KANs,这是一种新型的神经网络,其特点是在网络的边缘(而非节点)上放置可学习的激活函数。
- 网络架构:
- KANs的架构被设计为具有完全连接的结构,其中每个权重参数被一个作为样条的一元函数所替代,从而实现了激活函数的可学习性。
- 模型简化与解释性:
- 论文提出了网络简化技术,包括稀疏化、可视化和剪枝,以提高KANs的解释性,使其能够与人类用户直观地交互。
- 准确性与神经缩放律:
- 科学发现中的应用:
- 论文通过数学和物理学中的两个例子,展示了KANs作为科学家的“合作伙伴”在(重新)发现数学和物理定律方面的潜力。
- 代码实现: