WikiEdge:ArXiv速遞/2025-04-22
摘要
- 原文標題:TinyML for Speech Recognition
- 中文標題:面向語音識別的微型機器學習
- 發布日期:2025-04-22 19:00:40+00:00
- 作者:Andrew Barovic, Armin Moin
- 分類:cs.SD, cs.AI, eess.AS
- 原文鏈接:http://arxiv.org/abs/2504.16213v1
中文摘要:我們訓練並部署了一個量化的一維卷積神經網絡模型,用於在資源高度受限的物聯網邊緣設備上進行語音識別。這在各種物聯網(IoT)應用中非常有用,例如智能家居和為老年人及殘障人士提供的環境輔助生活等。在本文中,我們首先創建了一個包含超過一小時音頻數據的新數據集,這不僅支持了我們的研究,也將對該領域的未來研究有所幫助。其次,我們利用Edge Impulse提供的技術來提升模型性能,並在我們的數據集上實現了高達97%的準確率。為了驗證,我們使用Arduino Nano 33 BLE Sense微控制器板實現了原型。該微控制器板專為物聯網和人工智能應用設計,非常適合我們的目標使用場景。雖然現有研究大多集中於有限的關鍵詞集,但我們的模型可以處理23個不同的關鍵詞,從而實現複雜命令的識別。