WikiEdge:ArXiv-2408.17428v1/summary:修订间差异

来自WikiEdge
跳转到导航 跳转到搜索
David留言 | 贡献
Saved page by David
 
David留言 | 贡献
Saved page by David
 
(未显示同一用户的1个中间版本)
第1行: 第1行:
== 内容摘要 ==
<!-- 不要移除下面一行,如果有编辑错误,请直接修改该行以后的内容 -->
<div style="float: right;">[{{fullurl:WikiEdge:ArXiv-2408.17428v1/summary|action=edit}} 编辑]</div>
<div style="float: right;">[{{fullurl:WikiEdge:ArXiv-2408.17428v1/summary|action=edit}} 编辑]</div>
篇论介绍了种名为Context Leveraging OCR Correction (CLOCR-C) 的方法,旨在利用基于Transformer的语言模型(LMs)来提高光学字符识别(OCR)的质量。研究主要聚焦于历史印刷媒体档案的数字化尤其是报纸和期刊,这些文档由于布局复杂,OCR错误率较高。CLOCR-C通过结合语言模型的上下感知能力和提示中社会文化信息来纠正OCR错误,并提升游自然语言处理(NLP)任务的性能。
件是篇关于利用[[预训练语言模型]]进行[[光学字符识别]]([[OCR]]后处理的研究论文文的主要内容可以概括如
1. 引言部分讨论了数字化历史档案的重要性以及OCR在转换物理记录为数字文本过程中的误差问题。文中指出尽管已有多种OCR后处理方法,但利用大型语料库机器学习方法提高OCR后处理速度和质量是未来发展方向
# '''引言''':介绍了数字化历史印刷媒体档案的重要性以及OCR技术在转换物理记录为数字文本过程中的误差问题,特别是在[[报纸]][[期刊]]这类复杂布局文档中
2. CLOCR-C介绍部分阐述了该方法的核心思想,即利用预训练语言模型的充”能力来纠正OCR文本中的错误。研究目标验证LMs在报纸和期刊OCR输出的准确性提升、后CLOCR-C错误率游NLP任务的改善,以及社会文化语境在纠正过程中价值
# '''CLOCR-C介绍''':提出一种名为[[Context Leveraging OCR Correction]] (CLOCR-C) 的方法,该方法利用基于[[变换器]]的[[语言模型]]([[LMs]])的填补和适应上下文的能力来提高OCR质量
3. 方法论部分详细描述了数据集和抽样方法、所使用的语言模型、实验设置和评估方法。特别指出对19世纪期刊版(NCSE、《悉尼先驱晨报》《美国编年史》三个数据集的使以及对七个不同LMs测试
# '''目标和贡献''':明确了研究旨在回答的三个问题:LMs否能提高报纸和期刊OCR输出的准确性;CLOCR-C错误率的降低是否能改善游[[自然语言处理]]([[NLP]])任务以及提供社会文化上下文是否能提高OCR输出准确性
4. 实验结果表明,某些LMs显著降低错误率其中表现最好的模型在NCSE数据集上实现了超过60%的字符错误率降低。此外,OCR的改进也扩展到了下游任务如命名实体识别(NER,通过提高余弦命名实体相似度(CoNES)来实现
# '''方法论''':
5. 讨论总结了LMs在OCR后处理中的有效性并指出了提示对于短本LM性能敏感性。研究还探讨了社会文化语境对LM纠正性能的影响,发现提供真实的社会文化语境可以显著提高任务性能,误导性提示会降低性能。
#* '''数据集和抽样方法''':使用了包括19世纪期刊版([[NCSE]])和[[Overproof]]收藏中的两个数据集在内的三个数据集进行实验。
6. 结论部分强调了CLOCR-C作为一种有前景的OCR校正方法,利用LMs在提示中提供的社会文化信息,并通过OCR文本本身执行任务诱导的上下文学习。尽管CLOCR-C展现出潜力,但使用大型闭源模型的成本可能过高,这突显对训练开源模型进行进一步研究的需求,以使CLOCR-C成为一种更经济、更广泛应用的解决方案
#* '''语言模型''':比较了七种流行的LMs在OCR后处理上表现。
#* '''实验设置''':描述了于测试LMs的提示选择过程、评估指标以及对下游任务改进实验
# '''实验结果''':展示了不同LMs在OCR后处理上的性能,以及它们在下游任务[[命名实体识别]]上的影响。还探讨了社会文化上下文在OCR后处理成功中的作用
# '''讨论''':了LMs在OCR后处理中的表现以及提示的社会文化上下文对性能的影响
# '''结论''':总结了LMs可以用于OCR后处理并且提供文本的社会文化上下文可以改善性能,同时误导性提示会降低性能。提出了CLOCR-C作为一种有前景的OCR校正方法,并强调了进一步研究的需求。

2024年9月3日 (二) 10:33的最新版本

编辑

这份文件是一篇关于利用预训练语言模型进行光学字符识别OCR)后处理的研究论文,论文的主要内容可以概括如下:

  1. 引言:介绍了数字化历史印刷媒体档案的重要性以及OCR技术在转换物理记录为数字文本过程中的误差问题,特别是在报纸期刊这类复杂布局的文档中。
  2. CLOCR-C介绍:提出了一种名为Context Leveraging OCR Correction (CLOCR-C) 的方法,该方法利用基于变换器语言模型LMs)的填补和适应上下文的能力来提高OCR质量。
  3. 目标和贡献:明确了研究旨在回答的三个问题:LMs是否能提高报纸和期刊OCR输出的准确性;CLOCR-C错误率的降低是否能改善下游自然语言处理NLP)任务;以及提供社会文化上下文是否能提高OCR输出的准确性。
  4. 方法论
    • 数据集和抽样方法:使用了包括19世纪期刊版(NCSE)和Overproof收藏中的两个数据集在内的三个数据集进行实验。
    • 语言模型:比较了七种流行的LMs在OCR后处理上的表现。
    • 实验设置:描述了用于测试LMs的提示选择过程、评估指标以及对下游任务改进的实验。
  5. 实验结果:展示了不同LMs在OCR后处理上的性能,以及它们在下游任务(如命名实体识别)上的影响。还探讨了社会文化上下文在OCR后处理成功中的作用。
  6. 讨论:分析了LMs在OCR后处理中的表现,以及提示和文本的社会文化上下文对性能的影响。
  7. 结论:总结了LMs可以用于OCR后处理,并且提供文本的社会文化上下文可以改善性能,同时误导性的提示会降低性能。提出了CLOCR-C作为一种有前景的OCR校正方法,并强调了进一步研究的需求。