查看“WikiEdge:ArXiv速递/2025-04-04”的源代码

== 摘要 ==
* '''原文标题'''：An Efficient GPU-based Implementation for Noise Robust Sound Source Localization
* '''中文标题'''：基于GPU的高效噪声鲁棒声源定位实现
* '''发布日期'''：2025-04-04 11:44:24+00:00
* '''作者'''：Zirui Lin, Masayuki Takigahira, Naoya Terakado, Haris Gulzar, Monikka Roslianna Busto, Takeharu Eda, Katsutoshi Itoyama, Kazuhiro Nakadai, Hideharu Amano
* '''分类'''：cs.SD, cs.RO, eess.AS
*'''原文链接'''：http://arxiv.org/abs/2504.03373v1
'''中文摘要'''：[[机器人]][[听觉]][[技术]]涵盖[[声源定位]](SSL)、[[声源分离]](SSS)和[[自动语音识别]](ASR)，使[[机器人]]和[[智能设备]]能获得类似[[人类]][[听觉]]的能力。尽管应用广泛，但处理来自[[麦克风阵列]]的[[多通道]][[音频信号]]涉及计算密集的[[矩阵运算]]，这会影响在[[中央处理器]](CPU)上的高效部署，特别是在[[CPU]][[资源]][[有限]]的[[嵌入式系统]]中。本文提出了一种基于[[GPU]]的[[机器人]][[听觉]][[声源定位]]实现方案，在开源[[软件]][[套件]][[HARK]][[平台]]中采用基于[[广义奇异值分解]]的[[多重信号分类]](GSVD-MUSIC)这一[[抗噪]][[算法]]。针对60通道[[麦克风阵列]]，该实现方案取得了显著的[[性能]][[提升]]：在配备[[NVIDIA]][[GPU]]和[[ARM]][[Cortex-A78AE]][[v8.2]][[64位]][[CPU]]的[[嵌入式设备]][[Jetson AGX Orin]]上，[[GSVD]][[计算]][[加速比]]达4645.1倍，[[SSL]][[模块]][[加速比]]达8.8倍；在配置[[NVIDIA]][[A100]][[GPU]]和[[AMD]][[EPYC 7352]][[CPU]]的[[服务器]]上，[[GSVD]][[计算]][[加速比]]达2223.4倍，整个[[SSL]][[模块]][[加速比]]达8.95倍，使得大规模[[麦克风阵列]]的[[实时处理]]成为可能，并为后续潜在的[[机器学习]]或[[深度学习]][[任务]][[实时处理]]提供了充足[[容量]]。