WikiEdge:ArXiv速遞/2025-05-12
摘要
- 原文標題:Step1X-3D: Towards High-Fidelity and Controllable Generation of Textured 3D Assets
- 中文標題:Step1X-3D:面向高保真與可控紋理3D資產生成的框架
- 發佈日期:2025-05-12 16:56:30+00:00
- 作者:Weiyu Li, Xuanyang Zhang, Zheng Sun, Di Qi, Hao Li, Wei Cheng, Weiwei Cai, Shihao Wu, Jiarui Liu, Zihao Wang, Xiao Chen, Feipeng Tian, Jianxiong Pan, Zeming Li, Gang Yu, Xiangyu Zhang, Daxin Jiang, Ping Tan
- 分類:cs.CV
- 原文連結:http://arxiv.org/abs/2505.07747v1
中文摘要:摘要:儘管生成式人工智能在文本、圖像、音頻和視頻領域取得了顯著進展,但由於數據稀缺、算法限制和生態系統碎片化等根本性挑戰,3D生成領域仍相對欠發達。為此,我們提出了Step1X-3D這一開放框架,通過以下方式應對這些挑戰:(1) 嚴格的數據篩選流程處理超過500萬個資產,創建包含200萬個高質量資產的數據集,具有標準化的幾何和紋理屬性;(2) 採用兩階段原生3D架構,將混合VAE-DiT幾何生成器與基於擴散模型的紋理合成模塊相結合;(3) 完整開源模型、訓練代碼和適配模塊。在幾何生成方面,混合VAE-DiT組件通過採用基於感知器的潛在編碼和銳利邊緣採樣來保持細節,生成TSDF表示。基於擴散模型的紋理合成模塊則通過幾何條件約束和潛在空間同步確保跨視圖一致性。基準測試結果表明,該框架性能達到最先進水平,超越現有開源方法,同時與專有解決方案的質量相當。值得注意的是,該框架獨特地橋接了2D和3D生成範式,支持將2D控制技術(如LoRA)直接遷移到3D合成中。通過同步提升數據質量、算法保真度和可復現性,Step1X-3D旨在為可控3D資產生成的開放研究樹立新標準。
摘要
- 原文標題:Hydrogen peroxide electrosynthesis: A comparative study employing Vulcan carbon modification by different MnO2 nanostructures
- 中文標題:過氧化氫電合成:採用不同MnO2納米結構修飾Vulcan碳的對比研究
- 發佈日期:2025-05-12 14:40:37+00:00
- 作者:João Paulo C Moura, Vanessa S Antonin, Aline B Trench, Mauro C Santos
- 分類:cond-mat.mtrl-sci, physics.chem-ph
- 原文連結:http://arxiv.org/abs/2505.07616v1
中文摘要:本文比較了α-MnO2/Vulcan XC-72和δ-MnO2/Vulcan XC-72納米結構在過氧化氫(H2O2)電合成中的電化學性能。兩種材料均通過簡單水熱法製備,其結構和形貌通過SEM、HRTEM、XPS、拉曼散射和XRD進行表徵,並在鹼性NaOH溶液中採用旋轉環盤電極(RRDE)技術研究了其氧還原反應(ORR)電化學性能及H2O2電合成效率。同時開展了酸性介質中氣體擴散電極(GDE)的H2O2生成實驗。RRDE測試表明,3% δ-MnO2/C和1% α-MnO2/C電催化劑通過ORR雙電子途徑比純Vulcan XC-72更具效率和選擇性。在GDE體系進行H2O2電生成時,1% α-MnO2/C電催化劑表現出更優活性,在-1.9 V(vs Ag/AgCl)下反應120分鐘後過氧化物積累量達402.6 mg/L,比純Vulcan XC-72GDE提高48%。該結果可歸因於α-MnO2與Vulcan XC-72的協同效應,以及含氧酸性官能團的改善,增強了電催化表面親水性並促進H2O2電合成。
摘要
- 原文標題:Spatio-temporal pulse propagation during highly-resolved onset of Rayleigh-Taylor and Kelvin-Helmholtz Rayleigh-Taylor instabilities
- 中文標題:高解像度Rayleigh-Taylor和Kelvin-Helmholtz Rayleigh-Taylor不穩定性起始階段的時空脈衝傳播
- 發佈日期:2025-05-12 10:49:51+00:00
- 作者:Bhavna Joshi, Aditi Sengupta, Yassin Ajanif, Lucas Lestandi
- 分類:physics.flu-dyn
- 原文連結:http://arxiv.org/abs/2505.07433v1
中文摘要:本研究通過高解像度直接數值模擬,探究了瑞利-泰勒不穩定性(RTI)和開爾文-亥姆霍茲瑞利-泰勒不穩定性(KHRTI)的起始過程。模擬採用兩種三維長方體域配置,分別考慮不同溫度(或密度)和/或速度的空氣分佈在兩個半區。通過新型並行算法求解可壓縮納維-斯托克斯方程,該算法在子域邊界處不涉及重疊點。研究比較了RTI和KHRTI起始階段的壓力擾動場,並通過瞬態特徵、頻譜和本徵正交分解突出了對應的對流主導和平流主導機制。針對兩種不穩定性,探討了壓力、動能和旋轉能對總能量預算的相對貢獻,揭示聲學觸發是RTI和KHRTI共同的初始機制。通過應用可壓縮流渦量輸運方程,進一步探究了不穩定性的非線性時空特性。該研究為理解RTI與KHRTI起始機制的異同提供了新見解,其成果可作為剪切流與浮力驅動不穩定性研究的基準數據集,適用於地球物理、核能與大氣流體動力學等多領域應用。
摘要
- 原文標題:Step1X-3D: Towards High-Fidelity and Controllable Generation of Textured 3D Assets
- 中文標題:Step1X-3D:面向高保真可控紋理3D資產生成的框架
- 發佈日期:2025-05-12 16:56:30+00:00
- 作者:Weiyu Li, Xuanyang Zhang, Zheng Sun, Di Qi, Hao Li, Wei Cheng, Weiwei Cai, Shihao Wu, Jiarui Liu, Zihao Wang, Xiao Chen, Feipeng Tian, Jianxiong Pan, Zeming Li, Gang Yu, Xiangyu Zhang, Daxin Jiang, Ping Tan
- 分類:cs.CV
- 原文連結:http://arxiv.org/abs/2505.07747v1
中文摘要:摘要:儘管生成式人工智能在文本、圖像、音頻和視頻領域取得了顯著進展,但由於數據稀缺、算法限制和生態系統碎片化等根本性挑戰,3D生成領域仍相對欠發達。為此,我們提出了Step1X-3D開放框架,通過以下方式應對這些挑戰:(1) 嚴格的數據處理流程,對超過500萬個資產進行處理,創建包含200萬個高質量資產的數據集,具有標準化的幾何和紋理屬性;(2) 兩階段原生3D架構,將混合VAE-DiT幾何生成器與基於擴散模型的紋理合成模塊相結合;(3) 完整開源發佈模型、訓練代碼和適配模塊。在幾何生成方面,混合VAE-DiT組件通過採用基於感知器的潛在編碼和銳利邊緣採樣來保持細節,生成TSDF表示。基於擴散模型的紋理合成模塊則通過幾何條件約束和潛在空間同步確保跨視角一致性。基準測試結果表明,該框架性能達到最先進水平,超越現有開源方法,同時與專有解決方案的質量相當。值得注意的是,該框架獨特地橋接了2D和3D生成範式,支持將2D控制技術(如LoRA)直接遷移到3D合成中。通過同步提升數據質量、算法保真度和可復現性,Step1X-3D旨在為可控3D資產生成的開放研究樹立新標準。