WikiEdge:ArXiv速遞/2025-03-30

出自WikiEdge
跳至導覽 跳至搜尋

摘要

  • 原文標題:Evaluation of the Pronunciation of Tajweed Rules Based on DNN as a Step Towards Interactive Recitation Learning
  • 中文標題:基於深度神經網絡的特吉德規則發音評估:邁向交互式誦讀學習的一步
  • 發布日期:2025-03-30 15:03:02+00:00
  • 作者:Dim Shaiakhmetov, Gulnaz Gimaletdinova, Selcuk Cankurt, Kadyrmamat Momunov
  • 分類:cs.SD, eess.AS
  • 原文連結http://arxiv.org/abs/2503.23470v1

中文摘要:摘要:遵循《古蘭經》誦讀規則(Tajweed)的正確誦念對於避免誦讀錯誤至關重要,但需要大量練習才能掌握。傳統教學方法受限於合格教師的可及性和時間約束。通過提供即時反饋並支持自主練習,自動化的誦念評估能夠應對這些挑戰。本研究致力於開發深度學習模型,利用公開可用的QDAT數據集(包含1,500餘條錄音)對三個Tajweed規則進行分類:分離延長音Al Mad)、緊鼻音Ghunnah)和隱藏音Ikhfaa)。輸入數據來自該數據集的音頻錄音,並轉換為歸一化梅爾頻譜圖。分類採用EfficientNet-B0架構,併集成了擠壓-激勵注意力機制。所開發模型對上述規則的分類準確率分別達到95.35%、99.34%和97.01%。學習曲線分析證實了模型的魯棒性且未出現過擬合。該方法展現出高效性,為開發交互式Tajweed教學系統奠定了基礎。