WikiEdge:ArXiv速递/2025-04-22

来自WikiEdge
Carole留言 | 贡献2025年4月24日 (四) 06:59的版本 (Created page by Carole)
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳转到导航 跳转到搜索

摘要

  • 原文标题:TinyML for Speech Recognition
  • 中文标题:面向语音识别的微型机器学习
  • 发布日期:2025-04-22 19:00:40+00:00
  • 作者:Andrew Barovic, Armin Moin
  • 分类:cs.SD, cs.AI, eess.AS
  • 原文链接http://arxiv.org/abs/2504.16213v1

中文摘要:我们训练并部署了一个量化一维卷积神经网络模型,用于在资源高度受限的物联网边缘设备上进行语音识别。这在各种物联网IoT)应用中非常有用,例如智能家居和为老年人及残障人士提供的环境辅助生活等。在本文中,我们首先创建了一个包含超过一小时音频数据的新数据集,这不仅支持了我们的研究,也将对该领域的未来研究有所帮助。其次,我们利用Edge Impulse提供的技术来提升模型性能,并在我们的数据集上实现了高达97%的准确率。为了验证,我们使用Arduino Nano 33 BLE Sense微控制器板实现了原型。该微控制器板专为物联网人工智能应用设计,非常适合我们的目标使用场景。虽然现有研究大多集中于有限的关键词集,但我们的模型可以处理23个不同的关键词,从而实现复杂命令的识别。