WikiEdge:ArXiv速递/2025-04-04

来自WikiEdge
跳转到导航 跳转到搜索

摘要

  • 原文标题:An Efficient GPU-based Implementation for Noise Robust Sound Source Localization
  • 中文标题:基于GPU的高效噪声鲁棒声源定位实现
  • 发布日期:2025-04-04 11:44:24+00:00
  • 作者:Zirui Lin, Masayuki Takigahira, Naoya Terakado, Haris Gulzar, Monikka Roslianna Busto, Takeharu Eda, Katsutoshi Itoyama, Kazuhiro Nakadai, Hideharu Amano
  • 分类:cs.SD, cs.RO, eess.AS
  • 原文链接http://arxiv.org/abs/2504.03373v1

中文摘要机器人听觉技术涵盖声源定位(SSL)、声源分离(SSS)和自动语音识别(ASR),使机器人智能设备能获得类似人类听觉的能力。尽管应用广泛,但处理来自麦克风阵列多通道音频信号涉及计算密集的矩阵运算,这会影响在中央处理器(CPU)上的高效部署,特别是在CPU资源有限嵌入式系统中。本文提出了一种基于GPU机器人听觉声源定位实现方案,在开源软件套件HARK平台中采用基于广义奇异值分解多重信号分类(GSVD-MUSIC)这一抗噪算法。针对60通道麦克风阵列,该实现方案取得了显著的性能提升:在配备NVIDIAGPUARMCortex-A78AEv8.264位CPU嵌入式设备Jetson AGX Orin上,GSVD计算加速比达4645.1倍,SSL模块加速比达8.8倍;在配置NVIDIAA100GPUAMDEPYC 7352CPU服务器上,GSVD计算加速比达2223.4倍,整个SSL模块加速比达8.95倍,使得大规模麦克风阵列实时处理成为可能,并为后续潜在的机器学习深度学习任务实时处理提供了充足容量

摘要

  • 原文标题:The EMPI Code for Plasma-Induced Effects on Radio Waves I: Non-Magnetized Media and Applications to Fast Radio Bursts
  • 中文标题:等离子体对无线电波影响的EMPI代码 I:非磁化介质及快速射电暴应用
  • 发布日期:2025-04-04 08:44:55+00:00
  • 作者:Nan Xu, He Gao, Yuan-Pei Yang, Bing Zhang, Wei-Yang Wang, Tian-Cong Wang, Ran Gao
  • 分类:astro-ph.HE, physics.plasm-ph
  • 原文链接http://arxiv.org/abs/2504.03273v1

中文摘要电磁波等离子体中传播时会发生改变。我们提出了EMPI(电磁波-等离子体相互作用)三维数值框架,用于模拟射电信号冷等离子体间的相互作用。该代码通过输入等离子体密度分布、原始射电信号望远镜的时间和频率分辨率,基于第一性原理计算合成观测信号。EMPI能模拟多种等离子体分布,包括解析描述的平滑函数(如高斯分布指数分布)、统计模型(如湍流屏)以及难以用解析或统计方法建模的离散宏观结构(如孤立等离子体团)。验证测试表明,该代码能准确再现已知的等离子体传播效应,如色散透镜效应闪烁散射。该框架为处理解析和统计场景提供了高效方法,弥合了二者间的鸿沟。凭借其全面能力,EMPI特别适用于研究宇宙学起源的射电源(尤其是快速射电暴脉冲信号)。当这些信号穿越宇宙中多样复杂的等离子体环境时,其特性必然发生改变并产生可观测变化。在此背景下,EMPI成为研究这些源传播效应的有力工具,有助于深化对其本质及途经等离子体环境的认知。

摘要

  • 原文标题:Optimization of pulsed saturation transfer MR fingerprinting (ST MRF) acquisition using the Cramér-Rao bound and sequential quadratic programming
  • 中文标题:基于克拉美-罗界和序列二次规划的脉冲饱和转移磁共振指纹成像(ST MRF)采集优化
  • 发布日期:2025-04-04 09:24:05+00:00
  • 作者:Nikita Vladimirov, Moritz Zaiss, Or Perlman
  • 分类:physics.med-ph
  • 原文链接http://arxiv.org/abs/2504.03298v1

中文摘要:目的:开发一种优化脉冲饱和转移磁共振指纹成像(ST MRF)采集的方法。方法:基于Bloch-McConnell模拟信号采用克拉美-罗下界CRB)进行方差评估,随后进行数值序列二次规划优化及盆地跳跃法避免局部极小值。验证实验使用L-精氨酸仿体及健康志愿者(n=4)在3T场强下完成,扫描时间限制在40秒内。结果:与未优化的基线方案相比,所提出的优化方法显著提高了体内金标准参考值的一致性(NRMSE降低8%,SSIM提高7%,Pearson's r值提高15%,p<0.001)。结论:CRB序列二次规划及快速Bloch-McConnell模拟器的结合,为优化和加速脉冲化学交换饱和转移CEST)及半固态磁化转移MTMRF采集提供了有效手段。

摘要

  • 原文标题:Modeling and computing many-body electronic properties of twisted bilayer graphene with mechanical relaxation
  • 中文标题:考虑机械弛豫的扭转双层石墨烯多体电子特性建模与计算
  • 发布日期:2025-04-04 14:37:55+00:00
  • 作者:Tianyu Kong, Alexander B. Watson, Mitchell Luskin, Kevin D. Stubbs
  • 分类:math-ph, cond-mat.mes-hall, cond-mat.str-el, cs.NA, math.AP, math.MP, math.NA
  • 原文链接http://arxiv.org/abs/2504.03479v1

中文摘要:我们提出并计算了一个考虑结构弛豫效应的扭转双层石墨烯电子性质多体模型。通过将线性弹性与惩罚错配的堆叠能耦合来模拟机械弛豫,将所得泛函的极小值输入扭转双层石墨烯紧束缚模型,由此系统推导出单粒子连续摩尔尺度(类Bistritzer-MacDonald)模型。随后将该模型与库仑电子-电子相互作用项共同投影至单粒子模型平坦摩尔带中。我们数值计算了该模型的哈特里-福克基态,比较了竞争性多体基态相对能量

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们提出了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该方案采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎,这些IP核针对深度神经网络进行了优化,部署在Zynq UltraScale+ MPSoC平台上。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度的影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到每秒57.14帧和37.45帧的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,为星载CNN应用提供了高效灵活的解决方案。

摘要

  • 原文标题:A novel methodology to estimate pileup effects and induced error in microdosimetric spectra
  • 中文标题:一种估算微剂量能谱中堆积效应及诱导误差的新方法
  • 发布日期:2025-04-04 19:41:17+00:00
  • 作者:E. Pierobon, M. Missiaggia, F. G. Cordoni, C. La Tessa
  • 分类:physics.med-ph
  • 原文链接http://arxiv.org/abs/2504.03899v1

中文摘要微剂量学相比传统的基于线性能量转移(LET)的方法能更优地表征辐射场特性,因此其在粒子治疗中的质量保证应用日益受到关注。然而治疗中典型的粒子流强会导致堆积效应,这会扭曲实验能谱,从而影响微剂量测量的准确性,限制其在临床环境中的应用。本研究针对球形组织等效正比计数器(TEPC)中的堆积效应展开调查,并开发了一种评估该效应对实测能谱影响的算法。我们将TEPC暴露于11 MeV和70 MeV质子束下,在$10^3$-$10^6$ pps范围内收集微剂量能谱。通过结合GEANT4蒙特卡洛模拟实验数据,开发出能估算影响实验测量的堆积概率的算法。数据显示堆积概率随流强线性增长,在$28.2 \times 10^3$ pps时达到$15 \pm 3 \, \%$后开始饱和。两种质子能量的对比结果表明,该堆积估算方法可适用于预测相似能量临床质子束的影响。此方法可推广至各类微剂量测量,成为解决堆积问题和促进微剂量学临床应用的可靠工具。

摘要

  • 原文标题:Optimization of pulsed saturation transfer MR fingerprinting (ST MRF) acquisition using the Cramér-Rao bound and sequential quadratic programming
  • 中文标题:基于克拉美-罗界和序列二次规划的脉冲饱和转移磁共振指纹成像(ST MRF)采集优化
  • 发布日期:2025-04-04 09:24:05+00:00
  • 作者:Nikita Vladimirov, Moritz Zaiss, Or Perlman
  • 分类:physics.med-ph
  • 原文链接http://arxiv.org/abs/2504.03298v1

中文摘要:目的:开发一种优化脉冲饱和转移磁共振指纹成像(ST MRF)采集的方法。方法:基于Bloch-McConnell模拟信号采用克拉美-罗下界(CRB)进行方差评估,随后进行数值序列二次规划优化和盆地跳跃法避免局部极小值。验证过程使用L-精氨酸体模和健康人类志愿者(n=4)在3T场强下完成,同时将扫描时间限制在40秒以内。结果:与基线非优化方案相比,所提出的优化方法显著提高了体内结果与金标准参考值的一致性(归一化均方根误差降低8%,结构相似性指数提高7%,皮尔逊相关系数提高15%,p<0.001)。结论:CRB与序列二次规划及快速Bloch-McConnell模拟器的结合,为优化和加速脉冲化学交换饱和转移(CEST)及半固体磁化转移(MT)MRF采集提供了有效手段。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们提出了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该方案采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎(专为深度神经网络优化),部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,为星载CNN应用提供了高效灵活的解决方案。

摘要

  • 原文标题:A novel methodology to estimate pileup effects and induced error in microdosimetric spectra
  • 中文标题:一种估算微剂量能谱中堆积效应及诱导误差的新方法
  • 发布日期:2025-04-04 19:41:17+00:00
  • 作者:E. Pierobon, M. Missiaggia, F. G. Cordoni, C. La Tessa
  • 分类:physics.med-ph
  • 原文链接http://arxiv.org/abs/2504.03899v1

中文摘要微剂量学相比传统的基于线性能量转移LET)的方法能更优异地表征辐射场,因此其在粒子治疗中的质量保证方面日益受到关注。然而,治疗中典型的粒子通量会导致堆积效应,这会扭曲实验谱线,从而影响微剂量测量的准确性,限制其在临床中的应用。本研究针对球形组织等效正比计数器TEPC)中的堆积效应展开研究,并开发了一种评估该效应对测量谱线影响的算法。我们将TEPC暴露于11 MeV和70 MeV质子束下,在$10^3$-$10^6$ pps范围内收集微剂量谱。结合GEANT4蒙特卡洛模拟实验数据,开发出能估算影响实验测量的堆积概率的算法。数据显示堆积概率随通量呈线性增长,在$28.2 \times 10^3$ pps时达到$15 \pm 3 \, \%$后开始饱和。此外,两种质子能量的对比结果表明,该堆积估算方法可适用于预测相近能量临床质子束的影响。此方法可推广至各类微剂量测量,为解决堆积问题和推动微剂量学临床应用提供了可靠工具。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星星上云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们展示了四种基于FPGA加速的卷积神经网络(CNN)模型在资源受限的立方星任务中实现星载云检测的方案,该方案采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎,并部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,性能超越现有最先进的星载云检测方案。我们的方法证明了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,可实现高效灵活的星载CNN应用。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们提出了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该方案采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎,这些IP核针对深度神经网络进行了优化,部署在Zynq UltraScale+ MPSoC平台上。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度的影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到每秒57.14帧和37.45帧的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,为星载CNN应用提供了高效灵活的解决方案。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该研究采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎(专为深度神经网络优化),部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,量化剪枝后的累计最大精度下降仅0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的帧率,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,可实现高效灵活的星载CNN应用。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该研究采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎(专为深度神经网络优化),部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,为星载CNN应用提供了高效灵活的解决方案。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该研究采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎(专为深度神经网络优化),部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,为星载CNN应用提供了高效灵活的解决方案。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们提出了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该方案采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎,这些IP核专为深度神经网络优化,部署在Zynq UltraScale+ MPSoC平台上。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过应用通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到每秒57.14帧和37.45帧的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,为星载CNN应用提供了高效灵活的解决方案。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该方案采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎(专为深度神经网络优化),部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,量化剪枝后的累计最大精度下降仅0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的帧率,功耗约2.5瓦,性能超越现有最先进的星载云检测方案。我们的方法证明了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,可实现高效灵活的星载CNN应用。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星星载云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们提出了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该方案采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核可编程引擎(专为深度神经网络优化),部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,性能超越现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,为星载CNN应用提供了高效灵活的解决方案。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们提出了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该方案采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎,这些IP核专为深度神经网络优化,部署在Zynq UltraScale+ MPSoC平台上。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,为星载CNN应用提供了高效灵活的解决方案。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星星载云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们提出了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该方案采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎,这些IP核专为深度神经网络优化,部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,为星载CNN应用提供了高效灵活的解决方案。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该研究采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎(专为深度神经网络优化),部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,为星载CNN应用提供了高效灵活的解决方案。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该方案基于Xilinx Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎,这些IP核专为深度神经网络优化,部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度损失仅为0.6%。图像级模型Scene-NetU-Net展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,为星载CNN应用提供了高效灵活的解决方案。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该方案基于Xilinx Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎,部署于Zynq UltraScale+ MPSoC平台。本研究同时评估了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,量化剪枝后的累计最大精度损失仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,性能超越现有最先进的星载云检测方案。我们的方法证明了基于DPU硬件加速器在扩展小卫星处理能力方面的潜力,可实现高效灵活的星载CNN应用。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该研究采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎(专为深度神经网络优化),部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,为星载CNN应用提供了高效灵活的解决方案。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该研究采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核可编程引擎(专为深度神经网络优化),部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小卫星处理能力方面的潜力,可实现高效灵活的星载CNN应用。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该方案基于XilinxVitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎,这些IP核针对深度神经网络进行了优化,并部署在Zynq UltraScale+ MPSoC平台上。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过应用通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度的影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,能够实现高效灵活的星载CNN应用。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该研究采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎(专为深度神经网络优化),部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,为星载CNN应用提供了高效灵活的解决方案。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该方案采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎(专为深度神经网络优化),部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,量化剪枝后的累计最大精度下降仅0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法证明了基于DPU硬件加速器在扩展小卫星处理能力方面的潜力,可实现高效灵活的星载CNN应用。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该研究采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎,这些IP核针对深度神经网络进行了优化,部署在Zynq UltraScale+ MPSoC平台上。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度、延迟和模型复杂度之间的平衡。通过应用通道剪枝技术,我们在精度损失极小的情况下,实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度的影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化和剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到每秒57.14帧和37.45帧的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU的硬件加速器在扩展小型卫星处理能力方面的潜力,为星载CNN应用提供了高效灵活的解决方案。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该方案采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎,这些IP核专为深度神经网络优化,部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,量化剪枝后的累计最大精度下降仅0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小卫星处理能力方面的潜力,可实现高效灵活的星载CNN应用。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该研究采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎(专为深度神经网络优化),部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法证明了基于DPU硬件加速器在扩展小卫星处理能力方面的潜力,能够实现高效灵活的星载CNN应用。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该研究采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎(专为深度神经网络优化),部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,为星载CNN应用提供了高效灵活的解决方案。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该研究采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎(专为深度神经网络优化),部署在Zynq UltraScale+ MPSoC平台上。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,可实现高效灵活的星载CNN应用。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该方案采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎,这些IP核专为深度神经网络优化,部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,为星载CNN应用提供了高效灵活的解决方案。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星星上云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该研究采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎(专为深度神经网络优化),部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,可实现高效灵活的星载CNN应用。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该研究采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎(专为深度神经网络优化),部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,为星载CNN应用提供了高效灵活的解决方案。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该方案采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎,这些IP核针对深度神经网络进行了优化,部署在Zynq UltraScale+ MPSoC平台上。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,为星载CNN应用提供了高效灵活的解决方案。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们提出了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该方案采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎,这些IP核针对深度神经网络进行了优化,部署在Zynq UltraScale+ MPSoC平台上。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过应用通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,能够实现高效灵活的星载CNN应用。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该方案采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎(专为深度神经网络优化),部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法证明了基于DPU硬件加速器在扩展小卫星处理能力方面的潜力,可实现高效灵活的星载CNN应用。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该方案基于XilinxVitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎,这些IP核针对深度神经网络进行了优化,部署在Zynq UltraScale+ MPSoC平台上。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度的影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,为星载CNN应用提供了高效灵活的解决方案。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们提出了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该方案采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎,专为深度神经网络优化,部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,量化剪枝后的累计最大精度下降仅0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法彰显了基于DPU硬件加速器在扩展小卫星处理能力方面的潜力,可实现高效灵活的星载CNN应用。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们提出了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该方案采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎,这些IP核专为深度神经网络优化,部署在Zynq UltraScale+ MPSoC平台上。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,可实现高效灵活的星载CNN应用。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该方案采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎,这些IP核专为深度神经网络优化,部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,为星载CNN应用提供了高效灵活的解决方案。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该研究采用Xilinx Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎(专为深度神经网络优化),部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,可实现高效灵活的星载CNN应用。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该方案采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎,这些IP核专为深度神经网络优化,部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,量化剪枝后的累计最大精度下降仅0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,可实现高效灵活的星载CNN应用。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该方案采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎(专为深度神经网络优化),部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法证明了基于DPU硬件加速器在扩展小卫星处理能力方面的潜力,可实现高效灵活的星载CNN应用。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该方案采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎,这些IP核针对深度神经网络进行了优化,部署在Zynq UltraScale+ MPSoC平台上。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度的影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,为星载CNN应用提供了高效灵活的解决方案。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该研究采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎(专为深度神经网络优化),部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,可实现高效灵活的星载CNN应用。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该方案采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎(专为深度神经网络优化),部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高98.6%)和浮点运算量(最高90.7%)的大幅缩减。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,量化和剪枝后的累计最大精度下降仅0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的帧率,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,为星载CNN应用提供了高效灵活的解决方案。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该研究采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎(专为深度神经网络优化),部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,为星载CNN应用提供了高效灵活的解决方案。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们提出了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该方案基于XilinxVitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎,并部署在Zynq UltraScale+ MPSoC平台上。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,性能超越现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,为星载CNN应用提供了高效灵活的解决方案。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该研究采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎(专为深度神经网络优化),部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级模型Scene-NetU-Net展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,为星载CNN应用提供了高效灵活的解决方案。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该方案基于XilinxVitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎,并部署在Zynq UltraScale+ MPSoC平台上。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,量化和剪枝后的累计最大精度损失仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,为星载CNN应用提供了高效灵活的解决方案。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该研究采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎(专为深度神经网络优化),部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,可实现高效灵活的星载CNN应用。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该研究采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎(专为深度神经网络优化),部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,量化剪枝后的累计最大精度下降仅0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法证明了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,可实现高效灵活的星载CNN应用。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星星上云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该方案基于赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎,部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高98.6%)和浮点运算量(最高90.7%)的大幅缩减。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,量化剪枝后的累计最大精度损失仅0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法证明了基于DPU硬件加速器在扩展小卫星处理能力方面的潜力,可实现高效灵活的星载CNN应用。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星星上云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该研究采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎(专为深度神经网络优化),部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,量化剪枝后的累计最大精度下降仅0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的帧率,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小卫星处理能力方面的潜力,可实现高效灵活的星载CNN应用。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该研究采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎(专为深度神经网络优化),部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,可实现高效灵活的星载CNN应用。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该方案采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎,这些IP核专为深度神经网络优化,部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,为星载CNN应用提供了高效灵活的解决方案。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该研究采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎(专为深度神经网络优化),部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,为星载CNN应用提供了高效灵活的解决方案。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该研究采用XilinxVitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎(专为深度神经网络优化),部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,为星载CNN应用提供了高效灵活的解决方案。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该研究采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎(专为深度神经网络优化),部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,为星载CNN应用提供了高效灵活的解决方案。

摘要

  • 原文标题:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
  • 中文标题:面向立方体卫星云检测的高效FPGA加速卷积神经网络
  • 发布日期:2025-04-04 19:32:47+00:00
  • 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
  • 分类:eess.SP, cs.LG, cs.NE
  • 原文链接http://arxiv.org/abs/2504.03891v1

中文摘要:我们实现了四种基于FPGA加速的卷积神经网络(CNN)模型,用于资源受限的立方星任务中的星载云检测。该研究采用赛灵思Vitis AI(VAI)框架和深度学习处理单元(DPU)——一种搭载预实现、可参数化IP核的可编程引擎,这些IP核针对深度神经网络进行了优化,部署于Zynq UltraScale+ MPSoC平台。本研究同时探索了像素级(Pixel-NetPatch-Net)和图像级(U-NetScene-Net)模型,以权衡精度延迟模型复杂度之间的平衡。通过通道剪枝技术,我们在精度损失极小的情况下实现了模型参数(最高减少98.6%)和浮点运算量(最高减少90.7%)的大幅降低。此外,利用VAI工具将模型量化为8位精度,在保证硬件性能最优化的同时,对精度影响可忽略不计。所有模型在FPGA集成后均保持高精度,经过量化剪枝后的累计最大精度下降仅为0.6%。图像级Scene-NetU-Net模型展现出强大的实时推理能力,分别达到57.14帧/秒和37.45帧/秒的处理速度,功耗约2.5瓦,超越了现有最先进的星载云检测方案。我们的方法凸显了基于DPU硬件加速器在扩展小型卫星处理能力方面的潜力,为星载CNN应用提供了高效灵活的解决方案。