WikiEdge:ArXiv-2408.17428v1/questions:修订间差异

来自WikiEdge
跳转到导航 跳转到搜索
David留言 | 贡献
Saved page by David
David留言 | 贡献
Saved page by David
 
第1行: 第1行:
本文介绍了一种基于[[忆阻器]]的计算存储硬件加速器用于片上训练和推理,重点关注其设备变化、导电误差和输入噪声下的准确性和效率。
<div style="float: right;">[{{fullurl:WikiEdge:ArXiv-2408.17428v1/questions|action=edit}} 编辑]</div>
商业可用的基于[[]]的金属自定向通道(M-SDC忆阻器的真实SPICE模型,研究固有设备非理想性纳入电路仿真中
作者面对的是历史[[印刷媒体]]档案[[数字化]]过程中挑战特别是使用[[光学字符识别]]([[OCR]])技术实体记录转换为数字文本时出现错误问题具体问题包括:
硬件由30个忆阻器和4个[[神经元]]组成,利用[[]][[]][[]]质的不同的M-SDC结构执行二进制[[图像分类]]任务。
* [[OCR]]错误率高:特别是在[[报纸]][[期刊]]这类具有复杂布局的文档中,[[OCR]]技术容易出错,这影响了档案研究的量。
片上训练算精确调整忆阻器导电性以实现目标权重。结果表明训练期间加入适度噪声(<15%)可以增强对设备变化和噪声输入数据的[[鲁棒性]],
* 后[[OCR]]校正方法局限性:尽管已有多[[OCR]]校正方法,但2017年[[ICADAR]]后[[OCR]]校正竞赛显示只有大约一半的方法够提高[[OCR]]质量
即使在导电变化和输入噪声下也实现达97%的[[准确率]]。网络可以在不显著损失准确率的情况下容忍10%的导电误差。值得注意的是,
* 大型[[语言模型]]([[LMs]])进行后[[OCR]]校正潜力:尽管已有研究尝试使用[[语言模型]]进行后[[OCR]]校正,但先前研究并未发现[[语言模型]]能够提高[[OCR]]质量,作者试图证明这一点
在训练期间省略初始忆阻器重置脉冲可以显著减少训练时间和能量消耗。使基于铬忆阻器设计的硬件表现出优越的性能,
实现了2.4秒的训练时间和18.9毫焦耳的能量消耗。这项研究为开发[[边缘应用]]的[[片上学习]]的鲁棒和的基于忆阻器的[[神经网络]]提供了见解

2024年9月3日 (二) 10:34的最新版本

编辑

作者面对的是历史印刷媒体档案数字化过程中的挑战,特别是在使用光学字符识别OCR)技术将实体记录转换为数字文本时出现的错误问题。具体问题包括:

  • OCR错误率高:特别是在报纸期刊这类具有复杂布局的文档中,OCR技术容易出错,这影响了档案研究的质量。
  • OCR校正方法的局限性:尽管已有多种后OCR校正方法,但2017年ICADAROCR校正竞赛显示,只有大约一半的方法能够提高OCR质量。
  • 利用大型语言模型LMs)进行后OCR校正的潜力:尽管已有研究尝试使用语言模型进行后OCR校正,但先前的研究并未发现语言模型能够提高OCR质量,作者试图证明这一点。