查看“WikiEdge:ArXiv速递/2025-04-04”的源代码
←
WikiEdge:ArXiv速递/2025-04-04
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
== 摘要 == * '''原文标题''':An Efficient GPU-based Implementation for Noise Robust Sound Source Localization * '''中文标题''':基于GPU的高效噪声鲁棒声源定位实现 * '''发布日期''':2025-04-04 11:44:24+00:00 * '''作者''':Zirui Lin, Masayuki Takigahira, Naoya Terakado, Haris Gulzar, Monikka Roslianna Busto, Takeharu Eda, Katsutoshi Itoyama, Kazuhiro Nakadai, Hideharu Amano * '''分类''':cs.SD, cs.RO, eess.AS *'''原文链接''':http://arxiv.org/abs/2504.03373v1 '''中文摘要''':[[机器人]][[听觉]][[技术]]涵盖[[声源定位]](SSL)、[[声源分离]](SSS)和[[自动语音识别]](ASR),使[[机器人]]和[[智能设备]]能获得类似[[人类]][[听觉]]的能力。尽管应用广泛,但处理来自[[麦克风阵列]]的[[多通道]][[音频信号]]涉及计算密集的[[矩阵运算]],这会影响在[[中央处理器]](CPU)上的高效部署,特别是在[[CPU]][[资源]][[有限]]的[[嵌入式系统]]中。本文提出了一种基于[[GPU]]的[[机器人]][[听觉]][[声源定位]]实现方案,在开源[[软件]][[套件]][[HARK]][[平台]]中采用基于[[广义奇异值分解]]的[[多重信号分类]](GSVD-MUSIC)这一[[抗噪]][[算法]]。针对60通道[[麦克风阵列]],该实现方案取得了显著的[[性能]][[提升]]:在配备[[NVIDIA]][[GPU]]和[[ARM]][[Cortex-A78AE]][[v8.2]][[64位]][[CPU]]的[[嵌入式设备]][[Jetson AGX Orin]]上,[[GSVD]][[计算]][[加速比]]达4645.1倍,[[SSL]][[模块]][[加速比]]达8.8倍;在配置[[NVIDIA]][[A100]][[GPU]]和[[AMD]][[EPYC 7352]][[CPU]]的[[服务器]]上,[[GSVD]][[计算]][[加速比]]达2223.4倍,整个[[SSL]][[模块]][[加速比]]达8.95倍,使得大规模[[麦克风阵列]]的[[实时处理]]成为可能,并为后续潜在的[[机器学习]]或[[深度学习]][[任务]][[实时处理]]提供了充足[[容量]]。 == 摘要 == * '''原文标题''':The EMPI Code for Plasma-Induced Effects on Radio Waves I: Non-Magnetized Media and Applications to Fast Radio Bursts * '''中文标题''':等离子体对无线电波影响的EMPI代码 I:非磁化介质及快速射电暴应用 * '''发布日期''':2025-04-04 08:44:55+00:00 * '''作者''':Nan Xu, He Gao, Yuan-Pei Yang, Bing Zhang, Wei-Yang Wang, Tian-Cong Wang, Ran Gao * '''分类''':astro-ph.HE, physics.plasm-ph *'''原文链接''':http://arxiv.org/abs/2504.03273v1 '''中文摘要''':[[电磁波]]在[[等离子体]]中传播时会发生改变。我们提出了[[EMPI]](电磁波-等离子体相互作用)三维数值框架,用于模拟[[射电信号]]与[[冷等离子体]]间的相互作用。该代码通过输入[[等离子体密度分布]]、原始[[射电信号]]及[[望远镜]]的时间和[[频率分辨率]],基于[[第一性原理]]计算合成观测信号。[[EMPI]]能模拟多种等离子体分布,包括解析描述的平滑函数(如[[高斯分布]]或[[指数分布]])、统计模型(如[[湍流]]屏)以及难以用解析或统计方法建模的离散宏观结构(如孤立[[等离子体团]])。验证测试表明,该代码能准确再现已知的等离子体传播效应,如[[色散]]、[[透镜效应]]、[[闪烁]]和[[散射]]。该框架为处理解析和统计场景提供了高效方法,弥合了二者间的鸿沟。凭借其全面能力,[[EMPI]]特别适用于研究[[宇宙学]]起源的[[射电源]](尤其是[[快速射电暴]]等[[脉冲信号]])。当这些信号穿越宇宙中多样复杂的等离子体环境时,其特性必然发生改变并产生可观测变化。在此背景下,[[EMPI]]成为研究这些源传播效应的有力工具,有助于深化对其本质及途经等离子体环境的认知。 == 摘要 == * '''原文标题''':Optimization of pulsed saturation transfer MR fingerprinting (ST MRF) acquisition using the Cramér-Rao bound and sequential quadratic programming * '''中文标题''':基于克拉美-罗界和序列二次规划的脉冲饱和转移磁共振指纹成像(ST MRF)采集优化 * '''发布日期''':2025-04-04 09:24:05+00:00 * '''作者''':Nikita Vladimirov, Moritz Zaiss, Or Perlman * '''分类''':physics.med-ph *'''原文链接''':http://arxiv.org/abs/2504.03298v1 '''中文摘要''':目的:开发一种优化脉冲饱和转移[[磁共振指纹成像]](ST [[MRF]])采集的方法。方法:基于[[Bloch-McConnell模拟]]信号采用[[克拉美-罗下界]]([[CRB]])进行方差评估,随后进行数值[[序列二次规划]]优化及[[盆地跳跃法]]避免局部极小值。验证实验使用[[L-精氨酸]]仿体及健康志愿者(n=4)在[[3T场强]]下完成,扫描时间限制在40秒内。结果:与未优化的基线方案相比,所提出的优化方法显著提高了体内[[金标准]]参考值的一致性([[NRMSE]]降低8%,[[SSIM]]提高7%,[[Pearson's r]]值提高15%,p<0.001)。结论:[[CRB]]与[[序列二次规划]]及快速[[Bloch-McConnell模拟]]器的结合,为优化和加速脉冲[[化学交换饱和转移]]([[CEST]])及半固态[[磁化转移]]([[MT]])[[MRF]]采集提供了有效手段。 == 摘要 == * '''原文标题''':Modeling and computing many-body electronic properties of twisted bilayer graphene with mechanical relaxation * '''中文标题''':考虑机械弛豫的扭转双层石墨烯多体电子特性建模与计算 * '''发布日期''':2025-04-04 14:37:55+00:00 * '''作者''':Tianyu Kong, Alexander B. Watson, Mitchell Luskin, Kevin D. Stubbs * '''分类''':math-ph, cond-mat.mes-hall, cond-mat.str-el, cs.NA, math.AP, math.MP, math.NA *'''原文链接''':http://arxiv.org/abs/2504.03479v1 '''中文摘要''':我们提出并计算了一个考虑[[结构弛豫]]效应的[[扭转双层石墨烯]]电子性质[[多体模型]]。通过将[[线性弹性]]与惩罚错配的[[堆叠能]]耦合来模拟[[机械弛豫]],将所得泛函的极小值输入[[扭转双层石墨烯]][[紧束缚模型]],由此系统推导出[[单粒子]][[连续摩尔尺度]](类[[Bistritzer-MacDonald]])模型。随后将该模型与[[库仑]][[电子-电子相互作用]]项共同投影至[[单粒子模型]]的[[平坦摩尔带]]中。我们数值计算了该模型的[[哈特里-福克]][[基态]],比较了竞争性[[多体基态]]的[[相对能量]]。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们提出了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎,这些[[IP核]]针对[[深度神经网络]]进行了优化,部署在[[Zynq UltraScale+ MPSoC]]平台上。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度的影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。[[图像级]][[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到每秒57.14帧和37.45帧的处理速度,[[功耗]]约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,为星载[[CNN]]应用提供了高效灵活的解决方案。 == 摘要 == * '''原文标题''':A novel methodology to estimate pileup effects and induced error in microdosimetric spectra * '''中文标题''':一种估算微剂量能谱中堆积效应及诱导误差的新方法 * '''发布日期''':2025-04-04 19:41:17+00:00 * '''作者''':E. Pierobon, M. Missiaggia, F. G. Cordoni, C. La Tessa * '''分类''':physics.med-ph *'''原文链接''':http://arxiv.org/abs/2504.03899v1 '''中文摘要''':[[微剂量学]]相比传统的基于[[线性能量转移]]([[LET]])的方法能更优地表征[[辐射场]]特性,因此其在[[粒子治疗]]中的[[质量保证]]应用日益受到关注。然而治疗中典型的[[粒子流]]强会导致[[堆积效应]],这会扭曲[[实验能谱]],从而影响[[微剂量测量]]的准确性,限制其在[[临床环境]]中的应用。本研究针对[[球形组织等效正比计数器]]([[TEPC]])中的堆积效应展开调查,并开发了一种评估该效应对实测能谱影响的[[算法]]。我们将TEPC暴露于11 [[MeV]]和70 MeV[[质子束]]下,在$10^3$-$10^6$ [[pps]]范围内收集微剂量能谱。通过结合[[GEANT4]][[蒙特卡洛模拟]]与[[实验数据]],开发出能估算影响实验测量的堆积概率的算法。数据显示堆积概率随流强线性增长,在$28.2 \times 10^3$ pps时达到$15 \pm 3 \, \%$后开始饱和。两种[[质子能量]]的对比结果表明,该堆积估算方法可适用于预测相似能量临床质子束的影响。此方法可推广至各类微剂量测量,成为解决堆积问题和促进微剂量学临床应用的可靠工具。 == 摘要 == * '''原文标题''':Optimization of pulsed saturation transfer MR fingerprinting (ST MRF) acquisition using the Cramér-Rao bound and sequential quadratic programming * '''中文标题''':基于克拉美-罗界和序列二次规划的脉冲饱和转移磁共振指纹成像(ST MRF)采集优化 * '''发布日期''':2025-04-04 09:24:05+00:00 * '''作者''':Nikita Vladimirov, Moritz Zaiss, Or Perlman * '''分类''':physics.med-ph *'''原文链接''':http://arxiv.org/abs/2504.03298v1 '''中文摘要''':目的:开发一种优化脉冲饱和转移[[磁共振指纹成像]](ST MRF)采集的方法。方法:基于[[Bloch-McConnell方程|Bloch-McConnell模拟]]信号采用[[克拉美-罗下界]](CRB)进行方差评估,随后进行数值[[序列二次规划]]优化和[[盆地跳跃法]]避免局部极小值。验证过程使用[[L-精氨酸]]体模和健康人类志愿者(n=4)在[[3T]]场强下完成,同时将扫描时间限制在40秒以内。结果:与基线非优化方案相比,所提出的优化方法显著提高了体内结果与[[金标准]]参考值的一致性([[归一化均方根误差]]降低8%,[[结构相似性指数]]提高7%,[[皮尔逊相关系数]]提高15%,p<0.001)。结论:CRB与序列二次规划及快速Bloch-McConnell模拟器的结合,为优化和加速脉冲[[化学交换饱和转移]](CEST)及[[半固体磁化转移]](MT)MRF采集提供了有效手段。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们提出了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎(专为[[深度神经网络]]优化),部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,为星载[[CNN]]应用提供了高效灵活的解决方案。 == 摘要 == * '''原文标题''':A novel methodology to estimate pileup effects and induced error in microdosimetric spectra * '''中文标题''':一种估算微剂量能谱中堆积效应及诱导误差的新方法 * '''发布日期''':2025-04-04 19:41:17+00:00 * '''作者''':E. Pierobon, M. Missiaggia, F. G. Cordoni, C. La Tessa * '''分类''':physics.med-ph *'''原文链接''':http://arxiv.org/abs/2504.03899v1 '''中文摘要''':[[微剂量学]]相比传统的基于[[线性能量转移]]([[LET]])的方法能更优异地表征[[辐射场]],因此其在[[粒子治疗]]中的[[质量保证]]方面日益受到关注。然而,治疗中典型的[[粒子通量]]会导致[[堆积效应]],这会扭曲[[实验谱线]],从而影响[[微剂量测量]]的准确性,限制其在[[临床]]中的应用。本研究针对[[球形组织等效正比计数器]]([[TEPC]])中的堆积效应展开研究,并开发了一种评估该效应对测量谱线影响的[[算法]]。我们将TEPC暴露于11 [[MeV]]和70 MeV[[质子束]]下,在$10^3$-$10^6$ [[pps]]范围内收集[[微剂量谱]]。结合[[GEANT4]][[蒙特卡洛模拟]]与[[实验数据]],开发出能估算影响实验测量的[[堆积概率]]的算法。数据显示堆积概率随通量呈线性增长,在$28.2 \times 10^3$ pps时达到$15 \pm 3 \, \%$后开始[[饱和]]。此外,两种[[质子]][[能量]]的对比结果表明,该堆积估算方法可适用于预测相近能量临床质子束的影响。此方法可推广至各类微剂量测量,为解决堆积问题和推动微剂量学临床应用提供了可靠工具。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星星上云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们展示了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型在资源受限的[[立方星]]任务中实现[[星载云检测]]的方案,该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎,并部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,[[功耗]]约2.5瓦,性能超越现有最先进的[[星载云检测]]方案。我们的方法证明了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,可实现高效灵活的[[星载]][[CNN]]应用。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们提出了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎,这些[[IP核]]针对[[深度神经网络]]进行了优化,部署在[[Zynq UltraScale+ MPSoC]]平台上。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度的影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到每秒57.14帧和37.45帧的处理速度,功耗约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,为星载[[CNN]]应用提供了高效灵活的解决方案。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎(专为[[深度神经网络]]优化),部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算]]量(最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,[[量化]]和[[剪枝]]后的累计最大精度下降仅0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的[[帧率]],功耗约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,可实现高效灵活的星载[[CNN]]应用。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎(专为[[深度神经网络]]优化),部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算]]量(最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,为星载[[CNN]]应用提供了高效灵活的解决方案。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎(专为[[深度神经网络]]优化),部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,[[功耗]]约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,为星载[[CNN]]应用提供了高效灵活的解决方案。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们提出了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎,这些[[IP核]]专为[[深度神经网络]]优化,部署在[[Zynq UltraScale+ MPSoC]]平台上。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过应用[[通道剪枝]]技术,我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到每秒57.14帧和37.45帧的处理速度,[[功耗]]约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,为星载[[CNN]]应用提供了高效灵活的解决方案。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎(专为[[深度神经网络]]优化),部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,[[量化]]和[[剪枝]]后的累计最大精度下降仅0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的[[帧率]],功耗约2.5瓦,性能超越现有最先进的星载[[云检测]]方案。我们的方法证明了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,可实现高效灵活的星载[[CNN]]应用。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星星载云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们提出了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的[[可编程引擎]](专为[[深度神经网络]]优化),部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,[[功耗]]约2.5瓦,性能超越现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,为星载[[CNN]]应用提供了高效灵活的解决方案。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们提出了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎,这些[[IP核]]专为[[深度神经网络]]优化,部署在[[Zynq UltraScale+ MPSoC]]平台上。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,[[功耗]]约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,为星载[[CNN]]应用提供了高效灵活的解决方案。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星星载云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们提出了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎,这些[[IP核]]专为[[深度神经网络]]优化,部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,为星载[[CNN]]应用提供了高效灵活的解决方案。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎(专为[[深度神经网络]]优化),部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算]]量(最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,[[功耗]]约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,为星载[[CNN]]应用提供了高效灵活的解决方案。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':摘要:我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案基于[[Xilinx]] [[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎,这些[[IP核]]专为[[深度神经网络]]优化,部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算]]量(最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度损失仅为0.6%。图像级模型[[Scene-Net]]和[[U-Net]]展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,[[功耗]]约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,为星载[[CNN]]应用提供了高效灵活的解决方案。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案基于[[Xilinx]] [[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎,部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时评估了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,[[量化]]和[[剪枝]]后的累计最大精度损失仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,[[功耗]]约2.5瓦,性能超越现有最先进的星载[[云检测]]方案。我们的方法证明了基于[[DPU]]的[[硬件加速器]]在扩展[[小卫星]]处理能力方面的潜力,可实现高效灵活的星载[[CNN]]应用。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎(专为[[深度神经网络]]优化),部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,为星载[[CNN]]应用提供了高效灵活的解决方案。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的[[可编程引擎]](专为[[深度神经网络]]优化),部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14[[帧/秒]]和37.45[[帧/秒]]的处理速度,[[功耗]]约2.5[[瓦]],超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小卫星]]处理能力方面的潜力,可实现高效灵活的星载[[CNN]]应用。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':摘要:我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案基于[[Xilinx]]的[[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎,这些[[IP核]]针对[[深度神经网络]]进行了优化,并部署在[[Zynq UltraScale+ MPSoC]]平台上。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过应用[[通道剪枝]]技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算]]量(最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度的影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,能够实现高效灵活的星载[[CNN]]应用。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎(专为[[深度神经网络]]优化),部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,[[功耗]]约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,为星载[[CNN]]应用提供了高效灵活的解决方案。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':摘要:我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎(专为[[深度神经网络]]优化),部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,[[量化]]和[[剪枝]]后的累计最大精度下降仅0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,[[功耗]]约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法证明了基于[[DPU]]的[[硬件加速器]]在扩展[[小卫星]]处理能力方面的潜力,可实现高效灵活的星载[[CNN]]应用。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎,这些[[IP核]]针对[[深度神经网络]]进行了优化,部署在[[Zynq UltraScale+ MPSoC]]平台上。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型,以权衡精度、延迟和模型复杂度之间的平衡。通过应用[[通道剪枝]]技术,我们在精度损失极小的情况下,实现了模型参数(最高减少98.6%)和[[浮点运算]]量(最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度的影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过量化和剪枝后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的实时[[推理]]能力,分别达到每秒57.14帧和37.45帧的处理速度,功耗约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的硬件加速器在扩展小型[[卫星]]处理能力方面的潜力,为星载[[CNN]]应用提供了高效灵活的解决方案。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':摘要:我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎,这些[[IP核]]专为[[深度神经网络]]优化,部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,[[量化]]和[[剪枝]]后的累计最大精度下降仅0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,[[功耗]]约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小卫星]]处理能力方面的潜力,可实现高效灵活的星载[[CNN]]应用。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎(专为[[深度神经网络]]优化),部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法证明了基于[[DPU]]的[[硬件加速器]]在扩展[[小卫星]]处理能力方面的潜力,能够实现高效灵活的星载[[CNN]]应用。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎(专为[[深度神经网络]]优化),部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算]]量(最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,为星载[[CNN]]应用提供了高效灵活的解决方案。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎(专为[[深度神经网络]]优化),部署在[[Zynq UltraScale+ MPSoC]]平台上。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,[[功耗]]约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,可实现高效灵活的星载[[CNN]]应用。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎,这些[[IP核]]专为[[深度神经网络]]优化,部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,[[功耗]]约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,为星载[[CNN]]应用提供了高效灵活的解决方案。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星星上云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎(专为[[深度神经网络]]优化),部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,[[功耗]]约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,可实现高效灵活的星载[[CNN]]应用。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎(专为[[深度神经网络]]优化),部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,[[功耗]]约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,为星载[[CNN]]应用提供了高效灵活的解决方案。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':摘要:我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎,这些[[IP核]]针对[[深度神经网络]]进行了优化,部署在[[Zynq UltraScale+ MPSoC]]平台上。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,为星载[[CNN]]应用提供了高效灵活的解决方案。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们提出了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎,这些[[IP核]]针对[[深度神经网络]]进行了优化,部署在[[Zynq UltraScale+ MPSoC]]平台上。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过应用[[通道剪枝]]技术,我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。[[图像级]][[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,[[功耗]]约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,能够实现高效灵活的星载[[CNN]]应用。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎(专为[[深度神经网络]]优化),部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法证明了基于[[DPU]]的[[硬件加速器]]在扩展[[小卫星]]处理能力方面的潜力,可实现高效灵活的星载[[CNN]]应用。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案基于[[Xilinx]]的[[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎,这些[[IP核]]针对[[深度神经网络]]进行了优化,部署在[[Zynq UltraScale+ MPSoC]]平台上。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算]]量(最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度的影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,为星载[[CNN]]应用提供了高效灵活的解决方案。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们提出了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎,专为[[深度神经网络]]优化,部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,[[量化]]和[[剪枝]]后的累计最大精度下降仅0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,[[功耗]]约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法彰显了基于[[DPU]]的[[硬件加速器]]在扩展[[小卫星]]处理能力方面的潜力,可实现高效灵活的星载[[CNN]]应用。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们提出了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎,这些[[IP核]]专为[[深度神经网络]]优化,部署在[[Zynq UltraScale+ MPSoC]]平台上。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。[[图像级]][[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,[[功耗]]约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,可实现高效灵活的星载[[CNN]]应用。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':摘要:我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎,这些[[IP核]]专为[[深度神经网络]]优化,部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,[[功耗]]约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,为星载[[CNN]]应用提供了高效灵活的解决方案。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[Xilinx]] [[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎(专为[[深度神经网络]]优化),部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,[[功耗]]约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,可实现高效灵活的星载[[CNN]]应用。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':摘要:我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎,这些[[IP核]]专为[[深度神经网络]]优化,部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,[[量化]]和[[剪枝]]后的累计最大精度下降仅0.6%。[[图像级]][[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,[[功耗]]约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,可实现高效灵活的星载[[CNN]]应用。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎(专为[[深度神经网络]]优化),部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法证明了基于[[DPU]]的[[硬件加速器]]在扩展[[小卫星]]处理能力方面的潜力,可实现高效灵活的星载[[CNN]]应用。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎,这些[[IP核]]针对[[深度神经网络]]进行了优化,部署在[[Zynq UltraScale+ MPSoC]]平台上。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算]]量(最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度的影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,为星载[[CNN]]应用提供了高效灵活的解决方案。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎(专为[[深度神经网络]]优化),部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,[[功耗]]约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,可实现高效灵活的星载[[CNN]]应用。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎(专为[[深度神经网络]]优化),部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了模型参数(最高98.6%)和[[浮点运算]]量(最高90.7%)的大幅缩减。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,量化和剪枝后的累计最大精度下降仅0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的帧率,功耗约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,为星载[[CNN]]应用提供了高效灵活的解决方案。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎(专为[[深度神经网络]]优化),部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,[[功耗]]约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,为星载[[CNN]]应用提供了高效灵活的解决方案。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们提出了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案基于[[Xilinx]]的[[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎,并部署在[[Zynq UltraScale+ MPSoC]]平台上。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,性能超越现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,为星载[[CNN]]应用提供了高效灵活的解决方案。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎(专为[[深度神经网络]]优化),部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级模型[[Scene-Net]]和[[U-Net]]展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,[[功耗]]约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,为星载[[CNN]]应用提供了高效灵活的解决方案。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':摘要:我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案基于[[Xilinx]]的[[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎,并部署在[[Zynq UltraScale+ MPSoC]]平台上。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,量化和剪枝后的累计最大精度损失仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,为星载[[CNN]]应用提供了高效灵活的解决方案。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎(专为[[深度神经网络]]优化),部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,可实现高效灵活的星载[[CNN]]应用。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':摘要:我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎(专为[[深度神经网络]]优化),部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,[[量化]]和[[剪枝]]后的累计最大精度下降仅0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,[[功耗]]约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法证明了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,可实现高效灵活的星载[[CNN]]应用。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星星上云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':摘要:我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案基于[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎,部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了模型参数(最高98.6%)和[[浮点运算量]](最高90.7%)的大幅缩减。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,[[量化]]和[[剪枝]]后的累计最大精度损失仅0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,[[功耗]]约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法证明了基于[[DPU]]的[[硬件加速器]]在扩展[[小卫星]]处理能力方面的潜力,可实现高效灵活的星载[[CNN]]应用。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星星上云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎(专为[[深度神经网络]]优化),部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算]]量(最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,[[量化]]和[[剪枝]]后的累计最大精度下降仅0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的[[帧率]],功耗约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小卫星]]处理能力方面的潜力,可实现高效灵活的星载[[CNN]]应用。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎(专为[[深度神经网络]]优化),部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,[[功耗]]约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,可实现高效灵活的星载[[CNN]]应用。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎,这些[[IP核]]专为[[深度神经网络]]优化,部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算]]量(最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,为星载[[CNN]]应用提供了高效灵活的解决方案。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎(专为[[深度神经网络]]优化),部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,[[功耗]]约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,为星载[[CNN]]应用提供了高效灵活的解决方案。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[Xilinx]]的[[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎(专为[[深度神经网络]]优化),部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,[[功耗]]约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,为星载[[CNN]]应用提供了高效灵活的解决方案。 == 摘要 == * '''原文标题''':Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats * '''中文标题''':面向立方体卫星云检测的高效FPGA加速卷积神经网络 * '''发布日期''':2025-04-04 19:32:47+00:00 * '''作者''':Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller * '''分类''':eess.SP, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2504.03891v1 '''中文摘要''':我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型,用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎(专为[[深度神经网络]]优化),部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型,以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算]]量(最高减少90.7%)的大幅降低。此外,利用[[VAI]]工具将模型量化为[[8位精度]],在保证[[硬件性能]]最优化的同时,对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度,[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,[[功耗]]约2.5瓦,超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力,为星载[[CNN]]应用提供了高效灵活的解决方案。
返回
WikiEdge:ArXiv速递/2025-04-04
。
导航菜单
个人工具
创建账号
登录
命名空间
项目页面
讨论
不转换
不转换
简体
繁體
大陆简体
香港繁體
澳門繁體
大马简体
新加坡简体
臺灣正體
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
工具
链入页面
相关更改
特殊页面
页面信息