WikiEdge:ArXiv速遞/2025-04-22

出自WikiEdge
於 2025年4月24日 (四) 06:59 由 Carole留言 | 貢獻 所做的修訂 (Created page by Carole)
(差異) ←上個修訂 | 最新修訂 (差異) | 下個修訂→ (差異)
跳至導覽 跳至搜尋

摘要

  • 原文標題:TinyML for Speech Recognition
  • 中文標題:面向語音識別的微型機器學習
  • 發布日期:2025-04-22 19:00:40+00:00
  • 作者:Andrew Barovic, Armin Moin
  • 分類:cs.SD, cs.AI, eess.AS
  • 原文鏈接http://arxiv.org/abs/2504.16213v1

中文摘要:我們訓練並部署了一個量化一維卷積神經網絡模型,用於在資源高度受限的物聯網邊緣設備上進行語音識別。這在各種物聯網IoT)應用中非常有用,例如智能家居和為老年人及殘障人士提供的環境輔助生活等。在本文中,我們首先創建了一個包含超過一小時音頻數據的新數據集,這不僅支持了我們的研究,也將對該領域的未來研究有所幫助。其次,我們利用Edge Impulse提供的技術來提升模型性能,並在我們的數據集上實現了高達97%的準確率。為了驗證,我們使用Arduino Nano 33 BLE Sense微控制器板實現了原型。該微控制器板專為物聯網人工智能應用設計,非常適合我們的目標使用場景。雖然現有研究大多集中於有限的關鍵詞集,但我們的模型可以處理23個不同的關鍵詞,從而實現複雜命令的識別。