WikiEdge:ArXiv速递/2025-03-30
跳转到导航
跳转到搜索
摘要
- 原文标题:Evaluation of the Pronunciation of Tajweed Rules Based on DNN as a Step Towards Interactive Recitation Learning
- 中文标题:基于深度神经网络的特吉德规则发音评估:迈向交互式诵读学习的一步
- 发布日期:2025-03-30 15:03:02+00:00
- 作者:Dim Shaiakhmetov, Gulnaz Gimaletdinova, Selcuk Cankurt, Kadyrmamat Momunov
- 分类:cs.SD, eess.AS
- 原文链接:http://arxiv.org/abs/2503.23470v1
中文摘要:摘要:遵循《古兰经》诵读规则(Tajweed)的正确诵念对于避免诵读错误至关重要,但需要大量练习才能掌握。传统教学方法受限于合格教师的可及性和时间约束。通过提供即时反馈并支持自主练习,自动化的诵念评估能够应对这些挑战。本研究致力于开发深度学习模型,利用公开可用的QDAT数据集(包含1,500余条录音)对三个Tajweed规则进行分类:分离延长音(Al Mad)、紧鼻音(Ghunnah)和隐藏音(Ikhfaa)。输入数据来自该数据集的音频录音,并转换为归一化梅尔频谱图。分类采用EfficientNet-B0架构,并集成了挤压-激励注意力机制。所开发模型对上述规则的分类准确率分别达到95.35%、99.34%和97.01%。学习曲线分析证实了模型的鲁棒性且未出现过拟合。该方法展现出高效性,为开发交互式Tajweed教学系统奠定了基础。