查看“WikiEdge:ArXiv-2407.16674/summary”的源代码
←
WikiEdge:ArXiv-2407.16674/summary
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
<div style="float: right;">[{{fullurl:WikiEdge:ArXiv-2407.16674/summary|action=edit}} 编辑]</div> 这篇论文通过公平和全面的比较,探讨了[[Kolmogorov-Arnold Networks]](KAN)和[[多层感知器]](MLP)在不同任务中的性能差异。主要内容包括: # '''引言''':介绍了多层感知器(MLP)作为深度学习中的基础组件,以及Kolmogorov-Arnold Networks(KAN)作为MLP的创新替代方案。指出了现有比较实验的不公平性,并提出了在相同参数或[[浮点运算]](FLOPs)条件下进行公平比较的必要性。 # '''KAN和MLP的公式化定义''':详细描述了KAN和MLP的结构和工作原理,包括KAN的[[B样条]]分支和快捷分支,以及MLP的非线性操作。 # '''KAN和MLP的参数数量和FLOPs''':提供了计算KAN和MLP参数数量和FLOPs的公式,以确保在实验中对两者进行公平比较。 # '''实验''':在[[机器学习]]、[[计算机视觉]]、[[自然语言处理]]、[[音频处理]]和[[符号公式表示]]等多个领域的任务上,对KAN和MLP进行了广泛的实验比较。实验结果表明,除了在符号公式表示任务上KAN表现更好外,MLP在其他任务上通常优于KAN。 # '''架构消融研究''':通过消融研究分析了KAN和MLP的架构差异,发现KAN在符号公式表示任务上的优势主要来自于其B样条激活函数。当MLP使用B样条激活函数时,其在符号公式表示任务上的性能显著提高,甚至超过了KAN。 # '''持续学习''':在标准类增量持续学习设置中,发现KAN的遗忘问题比MLP更严重,这与KAN论文中的发现不同。 # '''相关工作''':讨论了KAN的相关工作,包括使用不同函数替代B样条的KAN变体,以及将KAN与现有网络结构结合的各种应用。 # '''结论''':总结了KAN和MLP在不同任务上的性能差异,指出KAN在符号公式表示任务上的优势,以及在其他任务上MLP的优越性。同时,发现在持续学习任务中,MLP比KAN具有更好的性能。
返回
WikiEdge:ArXiv-2407.16674/summary
。
导航菜单
个人工具
创建账号
登录
命名空间
项目页面
讨论
不转换
不转换
简体
繁體
大陆简体
香港繁體
澳門繁體
大马简体
新加坡简体
臺灣正體
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
工具
链入页面
相关更改
特殊页面
页面信息