查看“WikiEdge:ArXiv速递/2025-04-04”的源代码
←
WikiEdge:ArXiv速递/2025-04-04
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
== 摘要 == * '''原文标题''':An Efficient GPU-based Implementation for Noise Robust Sound Source Localization * '''中文标题''':基于GPU的高效噪声鲁棒声源定位实现 * '''发布日期''':2025-04-04 11:44:24+00:00 * '''作者''':Zirui Lin, Masayuki Takigahira, Naoya Terakado, Haris Gulzar, Monikka Roslianna Busto, Takeharu Eda, Katsutoshi Itoyama, Kazuhiro Nakadai, Hideharu Amano * '''分类''':cs.SD, cs.RO, eess.AS *'''原文链接''':http://arxiv.org/abs/2504.03373v1 '''中文摘要''':[[机器人]][[听觉]][[技术]]涵盖[[声源定位]](SSL)、[[声源分离]](SSS)和[[自动语音识别]](ASR),使[[机器人]]和[[智能设备]]能获得类似[[人类]][[听觉]]的能力。尽管应用广泛,但处理来自[[麦克风阵列]]的[[多通道]][[音频信号]]涉及计算密集的[[矩阵运算]],这会影响在[[中央处理器]](CPU)上的高效部署,特别是在[[CPU]][[资源]][[有限]]的[[嵌入式系统]]中。本文提出了一种基于[[GPU]]的[[机器人]][[听觉]][[声源定位]]实现方案,在开源[[软件]][[套件]][[HARK]][[平台]]中采用基于[[广义奇异值分解]]的[[多重信号分类]](GSVD-MUSIC)这一[[抗噪]][[算法]]。针对60通道[[麦克风阵列]],该实现方案取得了显著的[[性能]][[提升]]:在配备[[NVIDIA]][[GPU]]和[[ARM]][[Cortex-A78AE]][[v8.2]][[64位]][[CPU]]的[[嵌入式设备]][[Jetson AGX Orin]]上,[[GSVD]][[计算]][[加速比]]达4645.1倍,[[SSL]][[模块]][[加速比]]达8.8倍;在配置[[NVIDIA]][[A100]][[GPU]]和[[AMD]][[EPYC 7352]][[CPU]]的[[服务器]]上,[[GSVD]][[计算]][[加速比]]达2223.4倍,整个[[SSL]][[模块]][[加速比]]达8.95倍,使得大规模[[麦克风阵列]]的[[实时处理]]成为可能,并为后续潜在的[[机器学习]]或[[深度学习]][[任务]][[实时处理]]提供了充足[[容量]]。
返回
WikiEdge:ArXiv速递/2025-04-04
。
导航菜单
个人工具
创建账号
登录
命名空间
项目页面
讨论
不转换
不转换
简体
繁體
大陆简体
香港繁體
澳門繁體
大马简体
新加坡简体
臺灣正體
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
工具
链入页面
相关更改
特殊页面
页面信息