WikiEdge:ArXiv速递/2025-04-22

来自WikiEdge

Carole（留言 | 贡献）2025年4月24日 (四) 06:59的版本（Created page by Carole）

(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)

跳转到导航跳转到搜索

摘要

原文标题：TinyML for Speech Recognition
中文标题：面向语音识别的微型机器学习
发布日期：2025-04-22 19:00:40+00:00
作者：Andrew Barovic, Armin Moin
分类：cs.SD, cs.AI, eess.AS
原文链接：http://arxiv.org/abs/2504.16213v1

中文摘要：我们训练并部署了一个量化的一维卷积神经网络模型，用于在资源高度受限的物联网边缘设备上进行语音识别。这在各种物联网（IoT）应用中非常有用，例如智能家居和为老年人及残障人士提供的环境辅助生活等。在本文中，我们首先创建了一个包含超过一小时音频数据的新数据集，这不仅支持了我们的研究，也将对该领域的未来研究有所帮助。其次，我们利用Edge Impulse提供的技术来提升模型性能，并在我们的数据集上实现了高达97%的准确率。为了验证，我们使用Arduino Nano 33 BLE Sense 微控制器板实现了原型。该微控制器板专为物联网和人工智能应用设计，非常适合我们的目标使用场景。虽然现有研究大多集中于有限的关键词集，但我们的模型可以处理23个不同的关键词，从而实现复杂命令的识别。

取自“http://zh.wikiedge.org/index.php?title=WikiEdge:ArXiv速递/2025-04-22&oldid=7397”