查看“WikiEdge:ArXiv-2402.12875/questions”的源代码
←
WikiEdge:ArXiv-2402.12875/questions
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
<div style="float: right;">[{{fullurl:WikiEdge:ArXiv-2402.12875/questions|action=edit}} 编辑]</div> 作者面对的是大型语言模型([[LLMs]])在解决算术和符号推理任务时的准确性问题。具体问题包括: #* 并行计算的局限性:传统的[[变换器]]([[Transformers]])模型在处理需要串行计算的问题时存在固有的局限性,尤其是在模型深度较低时。 #* 表达能力的限制:先前研究表明,具有有限精度多项式([[poly(n)]])嵌入大小的恒定深度变换器在没有[[链式思考]]([[CoT]])的情况下,只能解决[[TC0]]类问题,而对于需要更复杂计算的问题则束手无策。 #* 链式思考([[CoT]])的有效性:尽管[[CoT]]已被证明可以显著提高[[LLMs]]在复杂推理任务上的准确性,但其背后的机制尚不清楚,需要进一步的理论分析和实证研究来揭示其提升模型推理能力的原因。
返回
WikiEdge:ArXiv-2402.12875/questions
。
导航菜单
个人工具
创建账号
登录
命名空间
项目页面
讨论
不转换
不转换
简体
繁體
大陆简体
香港繁體
澳門繁體
大马简体
新加坡简体
臺灣正體
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
工具
链入页面
相关更改
特殊页面
页面信息