WikiEdge:ArXiv速遞/2025-04-22

出自WikiEdge

於 2025年4月24日 (四) 06:59 由 Carole（留言 | 貢獻）所做的修訂（Created page by Carole）

(差異) ←上個修訂 | 最新修訂 (差異) | 下個修訂→ (差異)

跳至導覽跳至搜尋

摘要

原文標題：TinyML for Speech Recognition
中文標題：面向語音識別的微型機器學習
發布日期：2025-04-22 19:00:40+00:00
作者：Andrew Barovic, Armin Moin
分類：cs.SD, cs.AI, eess.AS
原文鏈接：http://arxiv.org/abs/2504.16213v1

中文摘要：我們訓練並部署了一個量化的一維卷積神經網絡模型，用於在資源高度受限的物聯網邊緣設備上進行語音識別。這在各種物聯網（IoT）應用中非常有用，例如智能家居和為老年人及殘障人士提供的環境輔助生活等。在本文中，我們首先創建了一個包含超過一小時音頻數據的新數據集，這不僅支持了我們的研究，也將對該領域的未來研究有所幫助。其次，我們利用Edge Impulse提供的技術來提升模型性能，並在我們的數據集上實現了高達97%的準確率。為了驗證，我們使用Arduino Nano 33 BLE Sense 微控制器板實現了原型。該微控制器板專為物聯網和人工智能應用設計，非常適合我們的目標使用場景。雖然現有研究大多集中於有限的關鍵詞集，但我們的模型可以處理23個不同的關鍵詞，從而實現複雜命令的識別。

取自「http://zh.wikiedge.org/index.php?title=WikiEdge:ArXiv速递/2025-04-22&oldid=7397」