WikiEdge:ArXiv速递/2025-03-30

来自WikiEdge
跳转到导航 跳转到搜索

摘要

  • 原文标题:Evaluation of the Pronunciation of Tajweed Rules Based on DNN as a Step Towards Interactive Recitation Learning
  • 中文标题:基于深度神经网络的特吉德规则发音评估:迈向交互式诵读学习的一步
  • 发布日期:2025-03-30 15:03:02+00:00
  • 作者:Dim Shaiakhmetov, Gulnaz Gimaletdinova, Selcuk Cankurt, Kadyrmamat Momunov
  • 分类:cs.SD, eess.AS
  • 原文链接http://arxiv.org/abs/2503.23470v1

中文摘要:摘要:遵循《古兰经》诵读规则(Tajweed)的正确诵念对于避免诵读错误至关重要,但需要大量练习才能掌握。传统教学方法受限于合格教师的可及性和时间约束。通过提供即时反馈并支持自主练习,自动化的诵念评估能够应对这些挑战。本研究致力于开发深度学习模型,利用公开可用的QDAT数据集(包含1,500余条录音)对三个Tajweed规则进行分类:分离延长音Al Mad)、紧鼻音Ghunnah)和隐藏音Ikhfaa)。输入数据来自该数据集的音频录音,并转换为归一化梅尔频谱图。分类采用EfficientNet-B0架构,并集成了挤压-激励注意力机制。所开发模型对上述规则的分类准确率分别达到95.35%、99.34%和97.01%。学习曲线分析证实了模型的鲁棒性且未出现过拟合。该方法展现出高效性,为开发交互式Tajweed教学系统奠定了基础。