查看“WikiEdge:ArXiv-2301.06627”的源代码
←
WikiEdge:ArXiv-2301.06627
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
* '''标题''':Dissociating language and thought in large language models * '''中文标题''':解构大型语言模型中的语言和思维 * '''发布日期''':2023-01-16 22:41:19+00:00 * '''作者''':Kyle Mahowald, Anna A. Ivanova, Idan A. Blank, Nancy Kanwisher, Joshua B. Tenenbaum, Evelina Fedorenko * '''分类''':cs.CL, cs.AI *'''原文链接''':http://arxiv.org/abs/2301.06627v3 '''摘要''':大型语言模型(LLMs)在迄今为止的所有模型中,最接近于掌握人类语言,然而对它们的语言和认知能力的看法仍然存在分歧。在这里,我们使用语言形式能力——语言规则和模式的知识——和功能语言能力——理解和使用语言——之间的区别来评估LLMs。我们将这种区别基于人类神经科学,它已经显示出形式和功能能力依赖于不同的神经机制。尽管LLMs在形式能力上表现出惊人的优势,但它们在功能能力任务上的表现仍然不稳定,通常需要专门的微调和/或与外部模块的耦合。我们认为,以人类方式使用语言的模型需要掌握这两种能力,这反过来可能需要形式语言能力的专门机制的出现,这与功能能力是不同的。
返回
WikiEdge:ArXiv-2301.06627
。
导航菜单
个人工具
创建账号
登录
命名空间
项目页面
讨论
不转换
不转换
简体
繁體
大陆简体
香港繁體
澳門繁體
大马简体
新加坡简体
臺灣正體
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
工具
链入页面
相关更改
特殊页面
页面信息