WikiEdge:ArXiv速遞/2025-04-04
摘要
- 原文標題:An Efficient GPU-based Implementation for Noise Robust Sound Source Localization
- 中文標題:基於GPU的高效噪聲魯棒聲源定位實現
- 發佈日期:2025-04-04 11:44:24+00:00
- 作者:Zirui Lin, Masayuki Takigahira, Naoya Terakado, Haris Gulzar, Monikka Roslianna Busto, Takeharu Eda, Katsutoshi Itoyama, Kazuhiro Nakadai, Hideharu Amano
- 分類:cs.SD, cs.RO, eess.AS
- 原文連結:http://arxiv.org/abs/2504.03373v1
中文摘要:機械人聽覺技術涵蓋聲源定位(SSL)、聲源分離(SSS)和自動語音識別(ASR),使機械人和智能設備能獲得類似人類聽覺的能力。儘管應用廣泛,但處理來自麥克風陣列的多通道音頻信號涉及計算密集的矩陣運算,這會影響在中央處理器(CPU)上的高效部署,特別是在CPU資源有限的嵌入式系統中。本文提出了一種基於GPU的機械人聽覺聲源定位實現方案,在開源軟件套件HARK平台中採用基於廣義奇異值分解的多重信號分類(GSVD-MUSIC)這一抗噪算法。針對60通道麥克風陣列,該實現方案取得了顯著的性能提升:在配備NVIDIAGPU和ARMCortex-A78AEv8.264位CPU的嵌入式設備Jetson AGX Orin上,GSVD計算加速比達4645.1倍,SSL模塊加速比達8.8倍;在配置NVIDIAA100GPU和AMDEPYC 7352CPU的伺服器上,GSVD計算加速比達2223.4倍,整個SSL模塊加速比達8.95倍,使得大規模麥克風陣列的實時處理成為可能,並為後續潛在的機器學習或深度學習任務實時處理提供了充足容量。
摘要
- 原文標題:The EMPI Code for Plasma-Induced Effects on Radio Waves I: Non-Magnetized Media and Applications to Fast Radio Bursts
- 中文標題:等離子體對無線電波影響的EMPI代碼 I:非磁化介質及快速射電暴應用
- 發佈日期:2025-04-04 08:44:55+00:00
- 作者:Nan Xu, He Gao, Yuan-Pei Yang, Bing Zhang, Wei-Yang Wang, Tian-Cong Wang, Ran Gao
- 分類:astro-ph.HE, physics.plasm-ph
- 原文連結:http://arxiv.org/abs/2504.03273v1
中文摘要:電磁波在等離子體中傳播時會發生改變。我們提出了EMPI(電磁波-等離子體相互作用)三維數值框架,用於模擬射電信號與冷等離子體間的相互作用。該代碼通過輸入等離子體密度分佈、原始射電信號及望遠鏡的時間和頻率解像度,基於第一性原理計算合成觀測信號。EMPI能模擬多種等離子體分佈,包括解析描述的平滑函數(如高斯分佈或指數分佈)、統計模型(如湍流屏)以及難以用解析或統計方法建模的離散宏觀結構(如孤立等離子體團)。驗證測試表明,該代碼能準確再現已知的等離子體傳播效應,如色散、透鏡效應、閃爍和散射。該框架為處理解析和統計場景提供了高效方法,彌合了二者間的鴻溝。憑藉其全面能力,EMPI特別適用於研究宇宙學起源的射電源(尤其是快速射電暴等脈衝信號)。當這些信號穿越宇宙中多樣複雜的等離子體環境時,其特性必然發生改變並產生可觀測變化。在此背景下,EMPI成為研究這些源傳播效應的有力工具,有助於深化對其本質及途經等離子體環境的認知。
摘要
- 原文標題:Optimization of pulsed saturation transfer MR fingerprinting (ST MRF) acquisition using the Cramér-Rao bound and sequential quadratic programming
- 中文標題:基於克拉美-羅界和序列二次規劃的脈衝飽和轉移磁共振指紋成像(ST MRF)採集優化
- 發佈日期:2025-04-04 09:24:05+00:00
- 作者:Nikita Vladimirov, Moritz Zaiss, Or Perlman
- 分類:physics.med-ph
- 原文連結:http://arxiv.org/abs/2504.03298v1
中文摘要:目的:開發一種優化脈衝飽和轉移磁共振指紋成像(ST MRF)採集的方法。方法:基於Bloch-McConnell模擬信號採用克拉美-羅下界(CRB)進行方差評估,隨後進行數值序列二次規劃優化及盆地跳躍法避免局部極小值。驗證實驗使用L-精氨酸仿體及健康志願者(n=4)在3T場強下完成,掃描時間限制在40秒內。結果:與未優化的基線方案相比,所提出的優化方法顯著提高了體內金標準參考值的一致性(NRMSE降低8%,SSIM提高7%,Pearson's r值提高15%,p<0.001)。結論:CRB與序列二次規劃及快速Bloch-McConnell模擬器的結合,為優化和加速脈衝化學交換飽和轉移(CEST)及半固態磁化轉移(MT)MRF採集提供了有效手段。
摘要
- 原文標題:Modeling and computing many-body electronic properties of twisted bilayer graphene with mechanical relaxation
- 中文標題:考慮機械弛豫的扭轉雙層石墨烯多體電子特性建模與計算
- 發佈日期:2025-04-04 14:37:55+00:00
- 作者:Tianyu Kong, Alexander B. Watson, Mitchell Luskin, Kevin D. Stubbs
- 分類:math-ph, cond-mat.mes-hall, cond-mat.str-el, cs.NA, math.AP, math.MP, math.NA
- 原文連結:http://arxiv.org/abs/2504.03479v1
中文摘要:我們提出並計算了一個考慮結構弛豫效應的扭轉雙層石墨烯電子性質多體模型。通過將線性彈性與懲罰錯配的堆疊能耦合來模擬機械弛豫,將所得泛函的極小值輸入扭轉雙層石墨烯緊束縛模型,由此系統推導出單粒子連續摩爾尺度(類Bistritzer-MacDonald)模型。隨後將該模型與庫侖電子-電子相互作用項共同投影至單粒子模型的平坦摩爾帶中。我們數值計算了該模型的哈特里-福克基態,比較了競爭性多體基態的相對能量。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們提出了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該方案採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎,這些IP核針對深度神經網絡進行了優化,部署在Zynq UltraScale+ MPSoC平台上。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度的影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到每秒57.14幀和37.45幀的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,為星載CNN應用提供了高效靈活的解決方案。
摘要
- 原文標題:A novel methodology to estimate pileup effects and induced error in microdosimetric spectra
- 中文標題:一種估算微劑量能譜中堆積效應及誘導誤差的新方法
- 發佈日期:2025-04-04 19:41:17+00:00
- 作者:E. Pierobon, M. Missiaggia, F. G. Cordoni, C. La Tessa
- 分類:physics.med-ph
- 原文連結:http://arxiv.org/abs/2504.03899v1
中文摘要:微劑量學相比傳統的基於線性能量轉移(LET)的方法能更優地表徵輻射場特性,因此其在粒子治療中的質量保證應用日益受到關注。然而治療中典型的粒子流強會導致堆積效應,這會扭曲實驗能譜,從而影響微劑量測量的準確性,限制其在臨床環境中的應用。本研究針對球形組織等效正比計數器(TEPC)中的堆積效應展開調查,並開發了一種評估該效應對實測能譜影響的算法。我們將TEPC暴露於11 MeV和70 MeV質子束下,在$10^3$-$10^6$ pps範圍內收集微劑量能譜。通過結合GEANT4蒙特卡洛模擬與實驗數據,開發出能估算影響實驗測量的堆積概率的算法。數據顯示堆積概率隨流強線性增長,在$28.2 \times 10^3$ pps時達到$15 \pm 3 \, \%$後開始飽和。兩種質子能量的對比結果表明,該堆積估算方法可適用於預測相似能量臨床質子束的影響。此方法可推廣至各類微劑量測量,成為解決堆積問題和促進微劑量學臨床應用的可靠工具。
摘要
- 原文標題:Optimization of pulsed saturation transfer MR fingerprinting (ST MRF) acquisition using the Cramér-Rao bound and sequential quadratic programming
- 中文標題:基於克拉美-羅界和序列二次規劃的脈衝飽和轉移磁共振指紋成像(ST MRF)採集優化
- 發佈日期:2025-04-04 09:24:05+00:00
- 作者:Nikita Vladimirov, Moritz Zaiss, Or Perlman
- 分類:physics.med-ph
- 原文連結:http://arxiv.org/abs/2504.03298v1
中文摘要:目的:開發一種優化脈衝飽和轉移磁共振指紋成像(ST MRF)採集的方法。方法:基於Bloch-McConnell模擬信號採用克拉美-羅下界(CRB)進行方差評估,隨後進行數值序列二次規劃優化和盆地跳躍法避免局部極小值。驗證過程使用L-精氨酸體模和健康人類志願者(n=4)在3T場強下完成,同時將掃描時間限制在40秒以內。結果:與基線非優化方案相比,所提出的優化方法顯著提高了體內結果與金標準參考值的一致性(歸一化均方根誤差降低8%,結構相似性指數提高7%,皮爾遜相關係數提高15%,p<0.001)。結論:CRB與序列二次規劃及快速Bloch-McConnell模擬器的結合,為優化和加速脈衝化學交換飽和轉移(CEST)及半固體磁化轉移(MT)MRF採集提供了有效手段。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們提出了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該方案採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎(專為深度神經網絡優化),部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,為星載CNN應用提供了高效靈活的解決方案。
摘要
- 原文標題:A novel methodology to estimate pileup effects and induced error in microdosimetric spectra
- 中文標題:一種估算微劑量能譜中堆積效應及誘導誤差的新方法
- 發佈日期:2025-04-04 19:41:17+00:00
- 作者:E. Pierobon, M. Missiaggia, F. G. Cordoni, C. La Tessa
- 分類:physics.med-ph
- 原文連結:http://arxiv.org/abs/2504.03899v1
中文摘要:微劑量學相比傳統的基於線性能量轉移(LET)的方法能更優異地表徵輻射場,因此其在粒子治療中的質量保證方面日益受到關注。然而,治療中典型的粒子通量會導致堆積效應,這會扭曲實驗譜線,從而影響微劑量測量的準確性,限制其在臨床中的應用。本研究針對球形組織等效正比計數器(TEPC)中的堆積效應展開研究,並開發了一種評估該效應對測量譜線影響的算法。我們將TEPC暴露於11 MeV和70 MeV質子束下,在$10^3$-$10^6$ pps範圍內收集微劑量譜。結合GEANT4蒙特卡洛模擬與實驗數據,開發出能估算影響實驗測量的堆積概率的算法。數據顯示堆積概率隨通量呈線性增長,在$28.2 \times 10^3$ pps時達到$15 \pm 3 \, \%$後開始飽和。此外,兩種質子能量的對比結果表明,該堆積估算方法可適用於預測相近能量臨床質子束的影響。此方法可推廣至各類微劑量測量,為解決堆積問題和推動微劑量學臨床應用提供了可靠工具。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星星上雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們展示了四種基於FPGA加速的卷積神經網絡(CNN)模型在資源受限的立方星任務中實現星載雲檢測的方案,該方案採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎,並部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,性能超越現有最先進的星載雲檢測方案。我們的方法證明了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,可實現高效靈活的星載CNN應用。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們提出了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該方案採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎,這些IP核針對深度神經網絡進行了優化,部署在Zynq UltraScale+ MPSoC平台上。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度的影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到每秒57.14幀和37.45幀的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,為星載CNN應用提供了高效靈活的解決方案。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該研究採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎(專為深度神經網絡優化),部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,量化和剪枝後的累計最大精度下降僅0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的幀率,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,可實現高效靈活的星載CNN應用。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該研究採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎(專為深度神經網絡優化),部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,為星載CNN應用提供了高效靈活的解決方案。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該研究採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎(專為深度神經網絡優化),部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,為星載CNN應用提供了高效靈活的解決方案。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們提出了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該方案採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎,這些IP核專為深度神經網絡優化,部署在Zynq UltraScale+ MPSoC平台上。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過應用通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到每秒57.14幀和37.45幀的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,為星載CNN應用提供了高效靈活的解決方案。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該方案採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎(專為深度神經網絡優化),部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,量化和剪枝後的累計最大精度下降僅0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的幀率,功耗約2.5瓦,性能超越現有最先進的星載雲檢測方案。我們的方法證明了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,可實現高效靈活的星載CNN應用。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星星載雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們提出了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該方案採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎(專為深度神經網絡優化),部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,性能超越現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,為星載CNN應用提供了高效靈活的解決方案。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們提出了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該方案採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎,這些IP核專為深度神經網絡優化,部署在Zynq UltraScale+ MPSoC平台上。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,為星載CNN應用提供了高效靈活的解決方案。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星星載雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們提出了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該方案採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎,這些IP核專為深度神經網絡優化,部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,為星載CNN應用提供了高效靈活的解決方案。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該研究採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎(專為深度神經網絡優化),部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,為星載CNN應用提供了高效靈活的解決方案。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該方案基於Xilinx Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎,這些IP核專為深度神經網絡優化,部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度損失僅為0.6%。圖像級模型Scene-Net和U-Net展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,為星載CNN應用提供了高效靈活的解決方案。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該方案基於Xilinx Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎,部署於Zynq UltraScale+ MPSoC平台。本研究同時評估了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,量化和剪枝後的累計最大精度損失僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,性能超越現有最先進的星載雲檢測方案。我們的方法證明了基於DPU的硬件加速器在擴展小衛星處理能力方面的潛力,可實現高效靈活的星載CNN應用。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該研究採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎(專為深度神經網絡優化),部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,為星載CNN應用提供了高效靈活的解決方案。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該研究採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎(專為深度神經網絡優化),部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小衛星處理能力方面的潛力,可實現高效靈活的星載CNN應用。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該方案基於Xilinx的Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎,這些IP核針對深度神經網絡進行了優化,並部署在Zynq UltraScale+ MPSoC平台上。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過應用通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度的影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,能夠實現高效靈活的星載CNN應用。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該研究採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎(專為深度神經網絡優化),部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,為星載CNN應用提供了高效靈活的解決方案。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該方案採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎(專為深度神經網絡優化),部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,量化和剪枝後的累計最大精度下降僅0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法證明了基於DPU的硬件加速器在擴展小衛星處理能力方面的潛力,可實現高效靈活的星載CNN應用。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該研究採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎,這些IP核針對深度神經網絡進行了優化,部署在Zynq UltraScale+ MPSoC平台上。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過應用通道剪枝技術,我們在精度損失極小的情況下,實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度的影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到每秒57.14幀和37.45幀的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,為星載CNN應用提供了高效靈活的解決方案。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該方案採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎,這些IP核專為深度神經網絡優化,部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,量化和剪枝後的累計最大精度下降僅0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小衛星處理能力方面的潛力,可實現高效靈活的星載CNN應用。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該研究採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎(專為深度神經網絡優化),部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法證明了基於DPU的硬件加速器在擴展小衛星處理能力方面的潛力,能夠實現高效靈活的星載CNN應用。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該研究採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎(專為深度神經網絡優化),部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,為星載CNN應用提供了高效靈活的解決方案。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該研究採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎(專為深度神經網絡優化),部署在Zynq UltraScale+ MPSoC平台上。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,可實現高效靈活的星載CNN應用。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該方案採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎,這些IP核專為深度神經網絡優化,部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,為星載CNN應用提供了高效靈活的解決方案。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星星上雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該研究採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎(專為深度神經網絡優化),部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,可實現高效靈活的星載CNN應用。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該研究採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎(專為深度神經網絡優化),部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,為星載CNN應用提供了高效靈活的解決方案。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該方案採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎,這些IP核針對深度神經網絡進行了優化,部署在Zynq UltraScale+ MPSoC平台上。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,為星載CNN應用提供了高效靈活的解決方案。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們提出了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該方案採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎,這些IP核針對深度神經網絡進行了優化,部署在Zynq UltraScale+ MPSoC平台上。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過應用通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,能夠實現高效靈活的星載CNN應用。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該方案採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎(專為深度神經網絡優化),部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法證明了基於DPU的硬件加速器在擴展小衛星處理能力方面的潛力,可實現高效靈活的星載CNN應用。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該方案基於Xilinx的Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎,這些IP核針對深度神經網絡進行了優化,部署在Zynq UltraScale+ MPSoC平台上。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度的影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,為星載CNN應用提供了高效靈活的解決方案。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們提出了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該方案採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎,專為深度神經網絡優化,部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,量化和剪枝後的累計最大精度下降僅0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法彰顯了基於DPU的硬件加速器在擴展小衛星處理能力方面的潛力,可實現高效靈活的星載CNN應用。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們提出了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該方案採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎,這些IP核專為深度神經網絡優化,部署在Zynq UltraScale+ MPSoC平台上。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,可實現高效靈活的星載CNN應用。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該方案採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎,這些IP核專為深度神經網絡優化,部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,為星載CNN應用提供了高效靈活的解決方案。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該研究採用Xilinx Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎(專為深度神經網絡優化),部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,可實現高效靈活的星載CNN應用。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該方案採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎,這些IP核專為深度神經網絡優化,部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,量化和剪枝後的累計最大精度下降僅0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,可實現高效靈活的星載CNN應用。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該方案採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎(專為深度神經網絡優化),部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法證明了基於DPU的硬件加速器在擴展小衛星處理能力方面的潛力,可實現高效靈活的星載CNN應用。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該方案採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎,這些IP核針對深度神經網絡進行了優化,部署在Zynq UltraScale+ MPSoC平台上。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度的影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,為星載CNN應用提供了高效靈活的解決方案。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該研究採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎(專為深度神經網絡優化),部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,可實現高效靈活的星載CNN應用。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該方案採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎(專為深度神經網絡優化),部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高98.6%)和浮點運算量(最高90.7%)的大幅縮減。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,量化和剪枝後的累計最大精度下降僅0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的幀率,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,為星載CNN應用提供了高效靈活的解決方案。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該研究採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎(專為深度神經網絡優化),部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,為星載CNN應用提供了高效靈活的解決方案。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們提出了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該方案基於Xilinx的Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎,並部署在Zynq UltraScale+ MPSoC平台上。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,性能超越現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,為星載CNN應用提供了高效靈活的解決方案。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該研究採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎(專為深度神經網絡優化),部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級模型Scene-Net和U-Net展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,為星載CNN應用提供了高效靈活的解決方案。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該方案基於Xilinx的Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎,並部署在Zynq UltraScale+ MPSoC平台上。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,量化和剪枝後的累計最大精度損失僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,為星載CNN應用提供了高效靈活的解決方案。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該研究採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎(專為深度神經網絡優化),部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,可實現高效靈活的星載CNN應用。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該研究採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎(專為深度神經網絡優化),部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,量化和剪枝後的累計最大精度下降僅0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法證明了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,可實現高效靈活的星載CNN應用。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星星上雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該方案基於賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎,部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高98.6%)和浮點運算量(最高90.7%)的大幅縮減。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,量化和剪枝後的累計最大精度損失僅0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法證明了基於DPU的硬件加速器在擴展小衛星處理能力方面的潛力,可實現高效靈活的星載CNN應用。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星星上雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該研究採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎(專為深度神經網絡優化),部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,量化和剪枝後的累計最大精度下降僅0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的幀率,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小衛星處理能力方面的潛力,可實現高效靈活的星載CNN應用。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該研究採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎(專為深度神經網絡優化),部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,可實現高效靈活的星載CNN應用。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該方案採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎,這些IP核專為深度神經網絡優化,部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,為星載CNN應用提供了高效靈活的解決方案。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該研究採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎(專為深度神經網絡優化),部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,為星載CNN應用提供了高效靈活的解決方案。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該研究採用Xilinx的Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎(專為深度神經網絡優化),部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,為星載CNN應用提供了高效靈活的解決方案。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該研究採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎(專為深度神經網絡優化),部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,為星載CNN應用提供了高效靈活的解決方案。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該研究採用賽靈思Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎,這些IP核針對深度神經網絡進行了優化,部署於Zynq UltraScale+ MPSoC平台。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,為星載CNN應用提供了高效靈活的解決方案。
摘要
- 原文標題:Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats
- 中文標題:面向立方體衛星雲檢測的高效FPGA加速卷積神經網絡
- 發佈日期:2025-04-04 19:32:47+00:00
- 作者:Angela Cratere, M. Salim Farissi, Andrea Carbone, Marcello Asciolla, Maria Rizzi, Francesco Dell'Olio, Augusto Nascetti, Dario Spiller
- 分類:eess.SP, cs.LG, cs.NE
- 原文連結:http://arxiv.org/abs/2504.03891v1
中文摘要:摘要:我們實現了四種基於FPGA加速的卷積神經網絡(CNN)模型,用於資源受限的立方星任務中的星載雲檢測。該方案基於Xilinx Vitis AI(VAI)框架和深度學習處理單元(DPU)——一種搭載預實現、可參數化IP核的可編程引擎,部署於Zynq UltraScale+ MPSoC平台並針對深度神經網絡進行了優化。本研究同時探索了像素級(Pixel-Net和Patch-Net)和圖像級(U-Net和Scene-Net)模型,以權衡精度、延遲和模型複雜度之間的平衡。通過通道剪枝技術,我們在精度損失極小的情況下實現了模型參數(最高減少98.6%)和浮點運算量(最高減少90.7%)的大幅降低。此外,利用VAI工具將模型量化為8位精度,在保證硬件性能最優化的同時,對精度的影響可忽略不計。所有模型在FPGA集成後均保持高精度,經過量化和剪枝後的累計最大精度下降僅為0.6%。圖像級Scene-Net和U-Net模型展現出強大的實時推理能力,分別達到57.14幀/秒和37.45幀/秒的處理速度,功耗約2.5瓦,超越了現有最先進的星載雲檢測方案。我們的方法凸顯了基於DPU的硬件加速器在擴展小型衛星處理能力方面的潛力,為星載CNN應用提供了高效靈活的解決方案。