查看“WikiEdge:ArXiv-2311.08516/methods”的源代码
←
WikiEdge:ArXiv-2311.08516/methods
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
<div style="float: right;">[{{fullurl:WikiEdge:ArXiv-2311.08516/methods|action=edit}} 编辑]</div> 这篇研究论文的工作方法主要围绕以下几个方面: # '''自我修正能力测试([[Self-Correction Ability Testing]])''': #* 通过在多个任务上测试多个最先进的[[大型语言模型]]([[LLMs]]),来评估它们在发现逻辑错误方面的能力。这些任务包括单词排序、追踪洗牌对象、逻辑推理、多步算术和[[Dyck语言]]。 # '''错误定位与修正([[Error Localization and Correction]])''': #* 利用[[回溯设置]]([[backtracking setup]]),将真实错误位置信息输入模型,测试LLMs在独立于错误发现的情况下修正错误的能力。这表明,即使LLMs在少量样本条件下难以发现错误,也可以通过训练小型[[分类器]]来提高错误定位的准确性。 # '''数据集构建与发布([[Dataset Construction and Release]])''': #* 构建并发布了[[BIG-Bench Mistake]]数据集,这是一个包含[[CoT]]风格推理步骤的数据集,用于进一步研究LLMs在推理错误定位上的能力。 # '''分类器训练([[Classifier Training]])''': #* 训练了一个小型分类器,使用领域外数据来展示在没有领域内训练数据的情况下,如何提高错误发现的准确性。这一方法为未来开发更复杂的错误发现方法提供了概念验证。
返回
WikiEdge:ArXiv-2311.08516/methods
。
导航菜单
个人工具
创建账号
登录
命名空间
项目页面
讨论
不转换
不转换
简体
繁體
大陆简体
香港繁體
澳門繁體
大马简体
新加坡简体
臺灣正體
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
工具
链入页面
相关更改
特殊页面
页面信息