查看“WikiEdge:ArXiv速递/2025-04-04”的源代码

== 摘要 ==
* '''原文标题'''：An Efficient GPU-based Implementation for Noise Robust Sound Source Localization
* '''中文标题'''：基于GPU的高效噪声鲁棒声源定位实现
* '''发布日期'''：2025-04-04 11:44:24+00:00
* '''作者'''：Zirui Lin, Masayuki Takigahira, Naoya Terakado, Haris Gulzar, Monikka Roslianna Busto, Takeharu Eda, Katsutoshi Itoyama, Kazuhiro Nakadai, Hideharu Amano
* '''分类'''：cs.SD, cs.RO, eess.AS
*'''原文链接'''：http://arxiv.org/abs/2504.03373v1
'''中文摘要'''：[[机器人]][[听觉]][[技术]]涵盖[[声源定位]](SSL)、[[声源分离]](SSS)和[[自动语音识别]](ASR)，使[[机器人]]和[[智能设备]]能获得类似[[人类]][[听觉]]的能力。尽管应用广泛，但处理来自[[麦克风阵列]]的[[多通道]][[音频信号]]涉及计算密集的[[矩阵运算]]，这会影响在[[中央处理器]](CPU)上的高效部署，特别是在[[CPU]][[资源]][[有限]]的[[嵌入式系统]]中。本文提出了一种基于[[GPU]]的[[机器人]][[听觉]][[声源定位]]实现方案，在开源[[软件]][[套件]][[HARK]][[平台]]中采用基于[[广义奇异值分解]]的[[多重信号分类]](GSVD-MUSIC)这一[[抗噪]][[算法]]。针对60通道[[麦克风阵列]]，该实现方案取得了显著的[[性能]][[提升]]：在配备[[NVIDIA]][[GPU]]和[[ARM]][[Cortex-A78AE]][[v8.2]][[64位]][[CPU]]的[[嵌入式设备]][[Jetson AGX Orin]]上，[[GSVD]][[计算]][[加速比]]达4645.1倍，[[SSL]][[模块]][[加速比]]达8.8倍；在配置[[NVIDIA]][[A100]][[GPU]]和[[AMD]][[EPYC 7352]][[CPU]]的[[服务器]]上，[[GSVD]][[计算]][[加速比]]达2223.4倍，整个[[SSL]][[模块]][[加速比]]达8.95倍，使得大规模[[麦克风阵列]]的[[实时处理]]成为可能，并为后续潜在的[[机器学习]]或[[深度学习]][[任务]][[实时处理]]提供了充足[[容量]]。

== 摘要 ==
* '''原文标题'''：The EMPI Code for Plasma-Induced Effects on Radio Waves I: Non-Magnetized Media and Applications to Fast Radio Bursts
* '''中文标题'''：等离子体对无线电波影响的EMPI代码 I：非磁化介质及快速射电暴应用
* '''发布日期'''：2025-04-04 08:44:55+00:00
* '''作者'''：Nan Xu, He Gao, Yuan-Pei Yang, Bing Zhang, Wei-Yang Wang, Tian-Cong Wang, Ran Gao
* '''分类'''：astro-ph.HE, physics.plasm-ph
*'''原文链接'''：http://arxiv.org/abs/2504.03273v1
'''中文摘要'''：[[电磁波]]在[[等离子体]]中传播时会发生改变。我们提出了[[EMPI]]（电磁波-等离子体相互作用）三维数值框架，用于模拟[[射电信号]]与[[冷等离子体]]间的相互作用。该代码通过输入[[等离子体密度分布]]、原始[[射电信号]]及[[望远镜]]的时间和[[频率分辨率]]，基于[[第一性原理]]计算合成观测信号。[[EMPI]]能模拟多种等离子体分布，包括解析描述的平滑函数（如[[高斯分布]]或[[指数分布]]）、统计模型（如[[湍流]]屏）以及难以用解析或统计方法建模的离散宏观结构（如孤立[[等离子体团]]）。验证测试表明，该代码能准确再现已知的等离子体传播效应，如[[色散]]、[[透镜效应]]、[[闪烁]]和[[散射]]。该框架为处理解析和统计场景提供了高效方法，弥合了二者间的鸿沟。凭借其全面能力，[[EMPI]]特别适用于研究[[宇宙学]]起源的[[射电源]]（尤其是[[快速射电暴]]等[[脉冲信号]]）。当这些信号穿越宇宙中多样复杂的等离子体环境时，其特性必然发生改变并产生可观测变化。在此背景下，[[EMPI]]成为研究这些源传播效应的有力工具，有助于深化对其本质及途经等离子体环境的认知。

== 摘要 ==
* '''原文标题'''：Optimization of pulsed saturation transfer MR fingerprinting (ST MRF) acquisition using the Cramér-Rao bound and sequential quadratic programming
* '''中文标题'''：基于克拉美-罗界和序列二次规划的脉冲饱和转移磁共振指纹成像(ST MRF)采集优化
* '''发布日期'''：2025-04-04 09:24:05+00:00
* '''作者'''：Nikita Vladimirov, Moritz Zaiss, Or Perlman
* '''分类'''：physics.med-ph
*'''原文链接'''：http://arxiv.org/abs/2504.03298v1
'''中文摘要'''：目的：开发一种优化脉冲饱和转移[[磁共振指纹成像]]（ST [[MRF]]）采集的方法。方法：基于[[Bloch-McConnell模拟]]信号采用[[克拉美-罗下界]]（[[CRB]]）进行方差评估，随后进行数值[[序列二次规划]]优化及[[盆地跳跃法]]避免局部极小值。验证实验使用[[L-精氨酸]]仿体及健康志愿者（n=4）在[[3T场强]]下完成，扫描时间限制在40秒内。结果：与未优化的基线方案相比，所提出的优化方法显著提高了体内[[金标准]]参考值的一致性（[[NRMSE]]降低8%，[[SSIM]]提高7%，[[Pearson's r]]值提高15%，p<0.001）。结论：[[CRB]]与[[序列二次规划]]及快速[[Bloch-McConnell模拟]]器的结合，为优化和加速脉冲[[化学交换饱和转移]]（[[CEST]]）及半固态[[磁化转移]]（[[MT]]）[[MRF]]采集提供了有效手段。

== 摘要 ==
* '''原文标题'''：Modeling and computing many-body electronic properties of twisted bilayer graphene with mechanical relaxation
* '''中文标题'''：考虑机械弛豫的扭转双层石墨烯多体电子特性建模与计算
* '''发布日期'''：2025-04-04 14:37:55+00:00
* '''作者'''：Tianyu Kong, Alexander B. Watson, Mitchell Luskin, Kevin D. Stubbs
* '''分类'''：math-ph, cond-mat.mes-hall, cond-mat.str-el, cs.NA, math.AP, math.MP, math.NA
*'''原文链接'''：http://arxiv.org/abs/2504.03479v1
'''中文摘要'''：我们提出并计算了一个考虑[[结构弛豫]]效应的[[扭转双层石墨烯]]电子性质[[多体模型]]。通过将[[线性弹性]]与惩罚错配的[[堆叠能]]耦合来模拟[[机械弛豫]]，将所得泛函的极小值输入[[扭转双层石墨烯]][[紧束缚模型]]，由此系统推导出[[单粒子]][[连续摩尔尺度]]（类[[Bistritzer-MacDonald]]）模型。随后将该模型与[[库仑]][[电子-电子相互作用]]项共同投影至[[单粒子模型]]的[[平坦摩尔带]]中。我们数值计算了该模型的[[哈特里-福克]][[基态]]，比较了竞争性[[多体基态]]的[[相对能量]]。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们提出了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎，这些[[IP核]]针对[[深度神经网络]]进行了优化，部署在[[Zynq UltraScale+ MPSoC]]平台上。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度的影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。[[图像级]][[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到每秒57.14帧和37.45帧的处理速度，[[功耗]]约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，为星载[[CNN]]应用提供了高效灵活的解决方案。

== 摘要 ==
* '''原文标题'''：A novel methodology to estimate pileup effects and induced error in microdosimetric spectra
* '''中文标题'''：一种估算微剂量能谱中堆积效应及诱导误差的新方法
* '''发布日期'''：2025-04-04 19:41:17+00:00
* '''作者'''：E. Pierobon, M. Missiaggia, F. G. Cordoni, C. La Tessa
* '''分类'''：physics.med-ph
*'''原文链接'''：http://arxiv.org/abs/2504.03899v1
'''中文摘要'''：[[微剂量学]]相比传统的基于[[线性能量转移]]([[LET]])的方法能更优地表征[[辐射场]]特性，因此其在[[粒子治疗]]中的[[质量保证]]应用日益受到关注。然而治疗中典型的[[粒子流]]强会导致[[堆积效应]]，这会扭曲[[实验能谱]]，从而影响[[微剂量测量]]的准确性，限制其在[[临床环境]]中的应用。本研究针对[[球形组织等效正比计数器]]([[TEPC]])中的堆积效应展开调查，并开发了一种评估该效应对实测能谱影响的[[算法]]。我们将TEPC暴露于11 [[MeV]]和70 MeV[[质子束]]下，在$10^3$-$10^6$ [[pps]]范围内收集微剂量能谱。通过结合[[GEANT4]][[蒙特卡洛模拟]]与[[实验数据]]，开发出能估算影响实验测量的堆积概率的算法。数据显示堆积概率随流强线性增长，在$28.2 \times 10^3$ pps时达到$15 \pm 3 \, \%$后开始饱和。两种[[质子能量]]的对比结果表明，该堆积估算方法可适用于预测相似能量临床质子束的影响。此方法可推广至各类微剂量测量，成为解决堆积问题和促进微剂量学临床应用的可靠工具。

== 摘要 ==
* '''原文标题'''：Optimization of pulsed saturation transfer MR fingerprinting (ST MRF) acquisition using the Cramér-Rao bound and sequential quadratic programming
* '''中文标题'''：基于克拉美-罗界和序列二次规划的脉冲饱和转移磁共振指纹成像(ST MRF)采集优化
* '''发布日期'''：2025-04-04 09:24:05+00:00
* '''作者'''：Nikita Vladimirov, Moritz Zaiss, Or Perlman
* '''分类'''：physics.med-ph
*'''原文链接'''：http://arxiv.org/abs/2504.03298v1
'''中文摘要'''：目的：开发一种优化脉冲饱和转移[[磁共振指纹成像]]（ST MRF）采集的方法。方法：基于[[Bloch-McConnell方程|Bloch-McConnell模拟]]信号采用[[克拉美-罗下界]]（CRB）进行方差评估，随后进行数值[[序列二次规划]]优化和[[盆地跳跃法]]避免局部极小值。验证过程使用[[L-精氨酸]]体模和健康人类志愿者（n=4）在[[3T]]场强下完成，同时将扫描时间限制在40秒以内。结果：与基线非优化方案相比，所提出的优化方法显著提高了体内结果与[[金标准]]参考值的一致性（[[归一化均方根误差]]降低8%，[[结构相似性指数]]提高7%，[[皮尔逊相关系数]]提高15%，p<0.001）。结论：CRB与序列二次规划及快速Bloch-McConnell模拟器的结合，为优化和加速脉冲[[化学交换饱和转移]]（CEST）及[[半固体磁化转移]]（MT）MRF采集提供了有效手段。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们提出了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎（专为[[深度神经网络]]优化），部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，功耗约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，为星载[[CNN]]应用提供了高效灵活的解决方案。

== 摘要 ==
* '''原文标题'''：A novel methodology to estimate pileup effects and induced error in microdosimetric spectra
* '''中文标题'''：一种估算微剂量能谱中堆积效应及诱导误差的新方法
* '''发布日期'''：2025-04-04 19:41:17+00:00
* '''作者'''：E. Pierobon, M. Missiaggia, F. G. Cordoni, C. La Tessa
* '''分类'''：physics.med-ph
*'''原文链接'''：http://arxiv.org/abs/2504.03899v1
'''中文摘要'''：[[微剂量学]]相比传统的基于[[线性能量转移]]（[[LET]]）的方法能更优异地表征[[辐射场]]，因此其在[[粒子治疗]]中的[[质量保证]]方面日益受到关注。然而，治疗中典型的[[粒子通量]]会导致[[堆积效应]]，这会扭曲[[实验谱线]]，从而影响[[微剂量测量]]的准确性，限制其在[[临床]]中的应用。本研究针对[[球形组织等效正比计数器]]（[[TEPC]]）中的堆积效应展开研究，并开发了一种评估该效应对测量谱线影响的[[算法]]。我们将TEPC暴露于11 [[MeV]]和70 MeV[[质子束]]下，在$10^3$-$10^6$ [[pps]]范围内收集[[微剂量谱]]。结合[[GEANT4]][[蒙特卡洛模拟]]与[[实验数据]]，开发出能估算影响实验测量的[[堆积概率]]的算法。数据显示堆积概率随通量呈线性增长，在$28.2 \times 10^3$ pps时达到$15 \pm 3 \, \%$后开始[[饱和]]。此外，两种[[质子]][[能量]]的对比结果表明，该堆积估算方法可适用于预测相近能量临床质子束的影响。此方法可推广至各类微剂量测量，为解决堆积问题和推动微剂量学临床应用提供了可靠工具。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星星上云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们展示了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型在资源受限的[[立方星]]任务中实现[[星载云检测]]的方案，该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎，并部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，[[功耗]]约2.5瓦，性能超越现有最先进的[[星载云检测]]方案。我们的方法证明了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，可实现高效灵活的[[星载]][[CNN]]应用。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们提出了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎，这些[[IP核]]针对[[深度神经网络]]进行了优化，部署在[[Zynq UltraScale+ MPSoC]]平台上。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度的影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到每秒57.14帧和37.45帧的处理速度，功耗约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，为星载[[CNN]]应用提供了高效灵活的解决方案。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎（专为[[深度神经网络]]优化），部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算]]量(最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，[[量化]]和[[剪枝]]后的累计最大精度下降仅0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的[[帧率]]，功耗约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，可实现高效灵活的星载[[CNN]]应用。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎（专为[[深度神经网络]]优化），部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算]]量(最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，功耗约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，为星载[[CNN]]应用提供了高效灵活的解决方案。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎（专为[[深度神经网络]]优化），部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了模型参数（最高减少98.6%）和[[浮点运算量]]（最高减少90.7%）的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，[[功耗]]约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，为星载[[CNN]]应用提供了高效灵活的解决方案。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们提出了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎，这些[[IP核]]专为[[深度神经网络]]优化，部署在[[Zynq UltraScale+ MPSoC]]平台上。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过应用[[通道剪枝]]技术，我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到每秒57.14帧和37.45帧的处理速度，[[功耗]]约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，为星载[[CNN]]应用提供了高效灵活的解决方案。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎（专为[[深度神经网络]]优化），部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，[[量化]]和[[剪枝]]后的累计最大精度下降仅0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的[[帧率]]，功耗约2.5瓦，性能超越现有最先进的星载[[云检测]]方案。我们的方法证明了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，可实现高效灵活的星载[[CNN]]应用。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星星载云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们提出了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的[[可编程引擎]]（专为[[深度神经网络]]优化），部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，[[功耗]]约2.5瓦，性能超越现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，为星载[[CNN]]应用提供了高效灵活的解决方案。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们提出了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎，这些[[IP核]]专为[[深度神经网络]]优化，部署在[[Zynq UltraScale+ MPSoC]]平台上。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，[[功耗]]约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，为星载[[CNN]]应用提供了高效灵活的解决方案。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星星载云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们提出了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎，这些[[IP核]]专为[[深度神经网络]]优化，部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，功耗约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，为星载[[CNN]]应用提供了高效灵活的解决方案。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎（专为[[深度神经网络]]优化），部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算]]量(最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，[[功耗]]约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，为星载[[CNN]]应用提供了高效灵活的解决方案。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：摘要：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案基于[[Xilinx]] [[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎，这些[[IP核]]专为[[深度神经网络]]优化，部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算]]量(最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度损失仅为0.6%。图像级模型[[Scene-Net]]和[[U-Net]]展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，[[功耗]]约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，为星载[[CNN]]应用提供了高效灵活的解决方案。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案基于[[Xilinx]] [[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎，部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时评估了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，[[量化]]和[[剪枝]]后的累计最大精度损失仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，[[功耗]]约2.5瓦，性能超越现有最先进的星载[[云检测]]方案。我们的方法证明了基于[[DPU]]的[[硬件加速器]]在扩展[[小卫星]]处理能力方面的潜力，可实现高效灵活的星载[[CNN]]应用。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎（专为[[深度神经网络]]优化），部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，功耗约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，为星载[[CNN]]应用提供了高效灵活的解决方案。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的[[可编程引擎]]（专为[[深度神经网络]]优化），部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14[[帧/秒]]和37.45[[帧/秒]]的处理速度，[[功耗]]约2.5[[瓦]]，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小卫星]]处理能力方面的潜力，可实现高效灵活的星载[[CNN]]应用。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：摘要：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案基于[[Xilinx]]的[[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎，这些[[IP核]]针对[[深度神经网络]]进行了优化，并部署在[[Zynq UltraScale+ MPSoC]]平台上。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过应用[[通道剪枝]]技术，我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算]]量(最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度的影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，功耗约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，能够实现高效灵活的星载[[CNN]]应用。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎（专为[[深度神经网络]]优化），部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，[[功耗]]约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，为星载[[CNN]]应用提供了高效灵活的解决方案。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：摘要：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎（专为[[深度神经网络]]优化），部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，[[量化]]和[[剪枝]]后的累计最大精度下降仅0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，[[功耗]]约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法证明了基于[[DPU]]的[[硬件加速器]]在扩展[[小卫星]]处理能力方面的潜力，可实现高效灵活的星载[[CNN]]应用。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎，这些[[IP核]]针对[[深度神经网络]]进行了优化，部署在[[Zynq UltraScale+ MPSoC]]平台上。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型，以权衡精度、延迟和模型复杂度之间的平衡。通过应用[[通道剪枝]]技术，我们在精度损失极小的情况下，实现了模型参数(最高减少98.6%)和[[浮点运算]]量(最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为8位精度，在保证硬件性能最优化的同时，对精度的影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过量化和剪枝后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的实时[[推理]]能力，分别达到每秒57.14帧和37.45帧的处理速度，功耗约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的硬件加速器在扩展小型[[卫星]]处理能力方面的潜力，为星载[[CNN]]应用提供了高效灵活的解决方案。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：摘要：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎，这些[[IP核]]专为[[深度神经网络]]优化，部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，[[量化]]和[[剪枝]]后的累计最大精度下降仅0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，[[功耗]]约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小卫星]]处理能力方面的潜力，可实现高效灵活的星载[[CNN]]应用。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎（专为[[深度神经网络]]优化），部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，功耗约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法证明了基于[[DPU]]的[[硬件加速器]]在扩展[[小卫星]]处理能力方面的潜力，能够实现高效灵活的星载[[CNN]]应用。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎（专为[[深度神经网络]]优化），部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算]]量(最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，功耗约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，为星载[[CNN]]应用提供了高效灵活的解决方案。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎（专为[[深度神经网络]]优化），部署在[[Zynq UltraScale+ MPSoC]]平台上。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了模型参数（最高减少98.6%）和[[浮点运算量]]（最高减少90.7%）的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，[[功耗]]约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，可实现高效灵活的星载[[CNN]]应用。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎，这些[[IP核]]专为[[深度神经网络]]优化，部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，[[功耗]]约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，为星载[[CNN]]应用提供了高效灵活的解决方案。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星星上云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎（专为[[深度神经网络]]优化），部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，[[功耗]]约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，可实现高效灵活的星载[[CNN]]应用。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎（专为[[深度神经网络]]优化），部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，[[功耗]]约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，为星载[[CNN]]应用提供了高效灵活的解决方案。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：摘要：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎，这些[[IP核]]针对[[深度神经网络]]进行了优化，部署在[[Zynq UltraScale+ MPSoC]]平台上。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，功耗约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，为星载[[CNN]]应用提供了高效灵活的解决方案。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们提出了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎，这些[[IP核]]针对[[深度神经网络]]进行了优化，部署在[[Zynq UltraScale+ MPSoC]]平台上。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过应用[[通道剪枝]]技术，我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。[[图像级]][[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，[[功耗]]约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，能够实现高效灵活的星载[[CNN]]应用。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎（专为[[深度神经网络]]优化），部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，功耗约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法证明了基于[[DPU]]的[[硬件加速器]]在扩展[[小卫星]]处理能力方面的潜力，可实现高效灵活的星载[[CNN]]应用。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案基于[[Xilinx]]的[[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎，这些[[IP核]]针对[[深度神经网络]]进行了优化，部署在[[Zynq UltraScale+ MPSoC]]平台上。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算]]量(最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度的影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，功耗约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，为星载[[CNN]]应用提供了高效灵活的解决方案。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们提出了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎，专为[[深度神经网络]]优化，部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，[[量化]]和[[剪枝]]后的累计最大精度下降仅0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，[[功耗]]约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法彰显了基于[[DPU]]的[[硬件加速器]]在扩展[[小卫星]]处理能力方面的潜力，可实现高效灵活的星载[[CNN]]应用。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们提出了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎，这些[[IP核]]专为[[深度神经网络]]优化，部署在[[Zynq UltraScale+ MPSoC]]平台上。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。[[图像级]][[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，[[功耗]]约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，可实现高效灵活的星载[[CNN]]应用。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：摘要：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎，这些[[IP核]]专为[[深度神经网络]]优化，部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，[[功耗]]约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，为星载[[CNN]]应用提供了高效灵活的解决方案。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[Xilinx]] [[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎（专为[[深度神经网络]]优化），部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，[[功耗]]约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，可实现高效灵活的星载[[CNN]]应用。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：摘要：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎，这些[[IP核]]专为[[深度神经网络]]优化，部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，[[量化]]和[[剪枝]]后的累计最大精度下降仅0.6%。[[图像级]][[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，[[功耗]]约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，可实现高效灵活的星载[[CNN]]应用。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎（专为[[深度神经网络]]优化），部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，功耗约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法证明了基于[[DPU]]的[[硬件加速器]]在扩展[[小卫星]]处理能力方面的潜力，可实现高效灵活的星载[[CNN]]应用。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎，这些[[IP核]]针对[[深度神经网络]]进行了优化，部署在[[Zynq UltraScale+ MPSoC]]平台上。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算]]量(最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度的影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，功耗约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，为星载[[CNN]]应用提供了高效灵活的解决方案。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎（专为[[深度神经网络]]优化），部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，[[功耗]]约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，可实现高效灵活的星载[[CNN]]应用。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎（专为[[深度神经网络]]优化），部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了模型参数(最高98.6%)和[[浮点运算]]量(最高90.7%)的大幅缩减。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，量化和剪枝后的累计最大精度下降仅0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的帧率，功耗约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，为星载[[CNN]]应用提供了高效灵活的解决方案。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎（专为[[深度神经网络]]优化），部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，[[功耗]]约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，为星载[[CNN]]应用提供了高效灵活的解决方案。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们提出了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案基于[[Xilinx]]的[[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎，并部署在[[Zynq UltraScale+ MPSoC]]平台上。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，功耗约2.5瓦，性能超越现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，为星载[[CNN]]应用提供了高效灵活的解决方案。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎（专为[[深度神经网络]]优化），部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级模型[[Scene-Net]]和[[U-Net]]展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，[[功耗]]约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，为星载[[CNN]]应用提供了高效灵活的解决方案。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：摘要：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案基于[[Xilinx]]的[[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎，并部署在[[Zynq UltraScale+ MPSoC]]平台上。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，量化和剪枝后的累计最大精度损失仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，功耗约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，为星载[[CNN]]应用提供了高效灵活的解决方案。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎（专为[[深度神经网络]]优化），部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，功耗约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，可实现高效灵活的星载[[CNN]]应用。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：摘要：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎（专为[[深度神经网络]]优化），部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，[[量化]]和[[剪枝]]后的累计最大精度下降仅0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，[[功耗]]约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法证明了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，可实现高效灵活的星载[[CNN]]应用。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星星上云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：摘要：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案基于[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎，部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了模型参数(最高98.6%)和[[浮点运算量]](最高90.7%)的大幅缩减。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，[[量化]]和[[剪枝]]后的累计最大精度损失仅0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，[[功耗]]约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法证明了基于[[DPU]]的[[硬件加速器]]在扩展[[小卫星]]处理能力方面的潜力，可实现高效灵活的星载[[CNN]]应用。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星星上云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎（专为[[深度神经网络]]优化），部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算]]量(最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，[[量化]]和[[剪枝]]后的累计最大精度下降仅0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的[[帧率]]，功耗约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小卫星]]处理能力方面的潜力，可实现高效灵活的星载[[CNN]]应用。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎（专为[[深度神经网络]]优化），部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，[[功耗]]约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，可实现高效灵活的星载[[CNN]]应用。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该方案采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎，这些[[IP核]]专为[[深度神经网络]]优化，部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算]]量(最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，功耗约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，为星载[[CNN]]应用提供了高效灵活的解决方案。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎（专为[[深度神经网络]]优化），部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，[[功耗]]约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，为星载[[CNN]]应用提供了高效灵活的解决方案。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[Xilinx]]的[[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎（专为[[深度神经网络]]优化），部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了[[像素级]]([[Pixel-Net]]和[[Patch-Net]])和[[图像级]]([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了[[模型参数]](最高减少98.6%)和[[浮点运算量]](最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，经过[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，[[功耗]]约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，为星载[[CNN]]应用提供了高效灵活的解决方案。

== 摘要 ==
* '''原文标题'''：Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
* '''中文标题'''：面向立方体卫星云检测的高效FPGA加速卷积神经网络
* '''发布日期'''：2025-04-04 19:32:47+00:00
* '''作者'''：Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
* '''分类'''：eess.SP, cs.LG, cs.NE
*'''原文链接'''：http://arxiv.org/abs/2504.03891v1
'''中文摘要'''：我们实现了四种基于[[FPGA]]加速的[[卷积神经网络]]([[CNN]])模型，用于资源受限的[[立方星]]任务中的星载[[云检测]]。该研究采用[[赛灵思]][[Vitis AI]]([[VAI]])框架和[[深度学习处理单元]]([[DPU]])——一种搭载预实现、可参数化[[IP核]]的可编程引擎（专为[[深度神经网络]]优化），部署于[[Zynq UltraScale+ MPSoC]]平台。本研究同时探索了像素级([[Pixel-Net]]和[[Patch-Net]])和图像级([[U-Net]]和[[Scene-Net]])模型，以权衡[[精度]]、[[延迟]]和[[模型复杂度]]之间的平衡。通过[[通道剪枝]]技术，我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和[[浮点运算]]量(最高减少90.7%)的大幅降低。此外，利用[[VAI]]工具将模型量化为[[8位精度]]，在保证[[硬件性能]]最优化的同时，对精度影响可忽略不计。所有模型在[[FPGA]]集成后均保持高精度，[[量化]]和[[剪枝]]后的累计最大精度下降仅为0.6%。图像级[[Scene-Net]]和[[U-Net]]模型展现出强大的[[实时推理]]能力，分别达到57.14帧/秒和37.45帧/秒的处理速度，[[功耗]]约2.5瓦，超越了现有最先进的星载[[云检测]]方案。我们的方法凸显了基于[[DPU]]的[[硬件加速器]]在扩展[[小型卫星]]处理能力方面的潜力，为星载[[CNN]]应用提供了高效灵活的解决方案。