WikiEdge:ArXiv-2408.17428v1/questions：修订间差异

←上一编辑

可视化wikitext

2024年9月3日 (二) 10:34的最新版本

编辑

作者面对的是历史印刷媒体档案数字化过程中的挑战，特别是在使用光学字符识别（OCR）技术将实体记录转换为数字文本时出现的错误问题。具体问题包括：

OCR错误率高：特别是在报纸和期刊这类具有复杂布局的文档中，OCR技术容易出错，这影响了档案研究的质量。
后OCR校正方法的局限性：尽管已有多种后OCR校正方法，但2017年ICADAR后OCR校正竞赛显示，只有大约一半的方法能够提高OCR质量。
利用大型语言模型（LMs）进行后OCR校正的潜力：尽管已有研究尝试使用语言模型进行后OCR校正，但先前的研究并未发现语言模型能够提高OCR质量，作者试图证明这一点。

@@ 第1行： / 第1行： @@
-本文介绍了一种基于[[忆阻器]]的计算存储硬件加速器，用于片上训练和推理，重点关注其在设备变化、导电误差和输入噪声下的准确性和效率。
+<div style="float: right;">[{{fullurl:WikiEdge:ArXiv-2408.17428v1/questions|action=edit}} 编辑]</div>
-利用商业可用的基于[[银]]的金属自定向通道（M-SDC）忆阻器的真实SPICE模型，研究将固有的设备非理想性纳入电路仿真中。
+作者面对的是历史[[印刷媒体]]档案[[数字化]]过程中的挑战，特别是在使用[[光学字符识别]]（[[OCR]]）技术将实体记录转换为数字文本时出现的错误问题。具体问题包括：
-硬件由30个忆阻器和4个[[神经元]]组成，利用[[钨]]、[[铬]]和[[碳]]介质的三种不同的M-SDC结构执行二进制[[图像分类]]任务。
+* [[OCR]]错误率高：特别是在[[报纸]]和[[期刊]]这类具有复杂布局的文档中，[[OCR]]技术容易出错，这影响了档案研究的质量。
-片上训练算法精确调整忆阻器导电性以实现目标权重。结果表明，训练期间加入适度噪声（<15%）可以增强对设备变化和噪声输入数据的[[鲁棒性]]，
+* 后[[OCR]]校正方法的局限性：尽管已有多种后[[OCR]]校正方法，但2017年[[ICADAR]]后[[OCR]]校正竞赛显示，只有大约一半的方法能够提高[[OCR]]质量。
-即使在导电变化和输入噪声下也能实现高达97%的[[准确率]]。网络可以在不显著损失准确率的情况下容忍10%的导电误差。值得注意的是，
+* 利用大型[[语言模型]]（[[LMs]]）进行后[[OCR]]校正的潜力：尽管已有研究尝试使用[[语言模型]]进行后[[OCR]]校正，但先前的研究并未发现[[语言模型]]能够提高[[OCR]]质量，作者试图证明这一点。
-在训练期间省略初始忆阻器重置脉冲可以显著减少训练时间和能量消耗。使用基于铬的忆阻器设计的硬件表现出优越的性能，
-实现了2.4秒的训练时间和18.9毫焦耳的能量消耗。这项研究为开发用于[[边缘应用]]的[[片上学习]]的鲁棒和能效高的基于忆阻器的[[神经网络]]提供了见解。

WikiEdge:ArXiv-2408.17428v1/questions：修订间差异

2024年9月3日 (二) 10:34的最新版本

导航菜单

搜索