WikiEdge:ArXiv速遞/2025-03-26
摘要
- 原文標題:Orbital optimization of large active spaces via AI-accelerators
- 中文標題:基於AI加速器的大活性空間軌道優化
- 發布日期:2025-03-26 16:29:44+00:00
- 作者:Örs Legeza, Andor Menczer, Ádám Ganyecz, Miklós Antal Werner, Kornél Kapás, Jeff Hammond, Sotiris S. Xantheas, Martin Ganahl, Frank Neese
- 分類:physics.chem-ph, cond-mat.str-el
- 原文鏈接:http://arxiv.org/abs/2503.20700v1
中文摘要:我們提出了一種高效的軌道優化方法,該方法將高度GPU加速的自旋適應密度矩陣重整化群(DMRG)方法與ORCA程序包中實現的量子化學完全活性空間自洽場(CAS-SCF)方法相結合。利用最新一代Nvidia GPU硬件的計算能力,我們在包含數千個軌道中數百個電子活性空間尺寸的分子體系中,實現了前所未有的CAS尺寸軌道優化——最高達82個電子和82個軌道CAS(82,82)。針對NVIDIA DGX-A100和DGX-H100硬件,我們對多環芳烴和不同尺寸鐵硫複合物構成的基準體系進行了詳細的DMRG-SCF方法縮放和誤差分析。我們的研究首次證明,在大鍵維度下進行高精度DMRG計算對獲得可靠收斂的CAS-SCF能量至關重要。對於更具挑戰性的鐵硫基準體系,我們還發現收斂CAS-SCF計算的優化軌道對DMRG參數的敏感性高於多環芳烴體系。這種能在數天內獲得如此大尺寸活性空間的收斂CAS-SCF能量和軌道的能力,降低了將適當軌道納入CAS或選擇正確最小CAS的挑戰,可能為解決強關聯分子體系開闢全新途徑。
摘要
- 原文標題:Supply chain network rewiring dynamics at the firm-level
- 中文標題:企業層面的供應鏈網絡重構動態
- 發布日期:2025-03-26 14:42:44+00:00
- 作者:Tobias Reisch, András Borsos, Stefan Thurner
- 分類:econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
- 原文鏈接:http://arxiv.org/abs/2503.20594v1
中文摘要:供應鏈網絡(SCN)構成任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體,形成了為所有人生產一切的社會新陳代謝系統。SCN絕非靜態存在,而是通過企業的進出和供應關係的重組持續演變。本研究利用獨特數據集追蹤了一個國家SCN中企業及其供需關係的時間演化。基於匈牙利2014至2022年按月申報的增值稅數據,我們重建了包含711,248家企業和38,644,400條連接的整體經濟網絡,以企業級分辨率捕捉了整個經濟體的每次重構事件。研究發現:每年約25%的企業退出SCN,同時28%的新企業加入;平均55%的年度供應關係會在次年消失;供應關係的半衰期為13個月。新連接以超偏好依附方式鏈接企業,概率滿足$p(i)\propto k_i^{1.08}$($k_i$表示企業$i$的連接數)。我們校準的簡易統計網絡生成模型成功復現了匈牙利主導SCN的典型特徵,不僅能重現入/出度分布、同配性和聚類結構等局部特徵,還能捕捉真實的系統性風險輪廓。該模型揭示了經濟重連動態對量化系統韌性和估計衝擊傳導的關鍵作用。
摘要
- 原文標題:The Scalar Size of the Pion from Lattice QCD
- 中文標題:格點QCD中π介子的標量尺寸
- 發布日期:2025-03-26 16:20:11+00:00
- 作者:Konstantin Ottnad, Georg von Hippel
- 分類:hep-lat, hep-ph
- 原文鏈接:http://arxiv.org/abs/2503.20687v1
中文摘要:我們提出了一種系統誤差完全受控的格點QCD計算,用於確定π介子標量形狀因子及相關半徑。計算結果基於17個規範系綜的大規模數據集,這些系綜採用$N_f=2+1$威爾遜Clover改進海夸克配置。這些系綜覆蓋了從$a=0.049\mathrm{fm}$到$a=0.086\mathrm{fm}$四種格點間距、$130-350\mathrm{MeV}$的π介子質量範圍以及多種物理體積。通過對著名的夸克斷開貢獻的精確測定,我們首次在接近物理夸克質量的大尺寸精細系綜上實現了形狀因子前所未有的動量分辨率。研究採用了$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$範圍內多種源匯間距,可靠地提取了零動量轉移和非零動量轉移下的相關基態矩陣元。這使得我們能夠首次通過所得形狀因子$Q^2$依賴性的$z$展開參數化(而非小動量轉移下的簡單線性近似)來獲取標量半徑。半徑的物理外推採用三味NLO手征微擾理論,以三個低能常數(包括$L_4^r$的首個格點測定值)來參數化夸克質量依賴性。通過基於赤池信息準則的模型平均方法,我們系統評估了基態提取、形狀因子參數化以及物理外推對最終結果的系統不確定性影響。
摘要
- 原文標題:Adaptive Local Clustering over Attributed Graphs
- 中文標題:基於屬性圖的自適應局部聚類
- 發布日期:2025-03-26 12:24:07+00:00
- 作者:Haoran Zheng, Renchi Yang, Jianliang Xu
- 分類:cs.SI, cs.DS, cs.LG
- 原文鏈接:http://arxiv.org/abs/2503.20488v1
中文摘要:摘要:給定圖$G$和種子節點$v_s$,局部圖聚類(LGC)的目標是在與$C_s$大小近似線性相關的時間內,識別出圍繞$v_s$的子圖$C_s$(即局部簇)。這種方法無需訪問整個圖即可生成個性化簇,使其特別適用於涉及大規模圖的應用場景。然而,現有解決方案大多僅依賴圖中節點的拓撲連接性,容易受到現實圖數據中普遍存在的缺失或噪聲鏈接的影響。為解決這一問題,本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息,我們首先將LGC建模為雙向擴散分布(BDD)的估計問題,該模型專門用於捕捉含屬性節點的多跳關聯性。進一步提出LACA方法——一種高效且具備嚴格理論保證的LGC解決方案,其核心包括:(i) 基於理論基礎的快速節點屬性預處理技術;(ii) 具有加速收斂特性的自適應向量擴散算法;(iii) 高效的三步式BDD近似方案。通過在8個真實數據集上與17種方法的對比實驗表明,LACA在真實局部簇的評估指標上全面優於現有方法,同時速度提升達數量級。代碼已開源:https://github.com/HaoranZ99/alac。
摘要
- 原文標題:High-Precision Ab Initio Radius Calculations of Boron Isotopes
- 中文標題:硼同位素高精度從頭算半徑計算
- 發布日期:2025-03-26 17:50:28+00:00
- 作者:Tobias Wolfgruber, Tobias Gesser, Marco Knöll, Pieter Maris, Robert Roth
- 分類:nucl-th
- 原文鏈接:http://arxiv.org/abs/2503.20764v1
中文摘要:我們採用手征有效場論中的多種現實相互作用對硼同位素半徑進行了精確研究。通過從頭算無核殼模型計算結合機器學習外推方法,我們獲得了具有完整不確定性量化的半徑預測值。進一步擴展到半徑差異研究後,我們得以探究$^{8}$B中可能存在的質子暈現象,並提供了與同位素位移直接相關的預測值——該位移可通過實驗進行精確測量。
摘要
- 原文標題:Search for events with one displaced vertex from long-lived neutral particles decaying into hadronic jets in the ATLAS muon spectrometer in $pp$ collisions at $\sqrt{s}=13$ TeV
- 中文標題:在$\sqrt{s}=13$ TeV質子-質子對撞中利用ATLASμ子譜儀尋找長壽命中性粒子衰變為強子噴注的單位移頂點事例
- 發布日期:2025-03-26 11:21:36+00:00
- 作者:ATLAS Collaboration
- 分類:hep-ex
- 原文鏈接:http://arxiv.org/abs/2503.20445v1
中文摘要:摘要:本文報道了利用大型強子對撞機ATLAS探測器在2015-2018年收集的140 fb$^{-1}$、質心能量$\sqrt{s}=13$ TeV的質子-質子對撞數據,對長壽命中性粒子衰變為強子噴注並在μ子譜儀中產生位移頂點(距主相互作用頂點3-14米)的事件進行搜尋。觀測到的事件數與預期本底一致,並對若干基準信號模型給出了限制。研究考慮了標量門戶模型和希格斯玻色子門戶重子生成模型,並採用專用分析道針對Z玻色子伴隨產生的長壽命粒子(包括類軸子粒子和暗光子模型)進行探測。對於希格斯玻色子模型,在95%置信水平下排除了長壽命粒子固有衰變長度在5厘米至40米範圍內、分支比高於1%的情況。對於所研究的避光類軸子粒子模型,本次搜尋對固有衰變長度大於$\mathcal{O}(10)$厘米的情況給出了迄今最強的限制。
摘要
- 原文標題:Ion beam treatment of thick polystyrene films
- 中文標題:厚聚苯乙烯薄膜的離子束處理
- 發布日期:2025-03-26 09:39:21+00:00
- 作者:Alexey Kondyurin
- 分類:physics.chem-ph
- 原文鏈接:http://arxiv.org/abs/2503.20359v1
中文摘要:摘要:在硅片上旋塗厚度為78 nm至1.3 μm的聚苯乙烯薄膜經20 keV氮離子束處理後,橢圓偏振測量和FTIR光譜顯示表面改性層與離子在聚合物中的穿透深度(約70 nm)相符。然而,深層洗滌及後續測試表明,薄改性層中形成的自由基會遷移至體層,導致深層聚苯乙烯發生一系列化學結構變化。因此,儘管離子在聚苯乙烯膜中的穿透深度較淺,但整個薄膜的改性深度遠超過離子投射範圍。這表明離子束處理僅能條件性地視為表面改性方法,必須考慮自由基反應及其向聚合物深層遷移的可能性。
摘要
- 原文標題:Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
- 中文標題:高斯位置混合的非參數極大似然估計:可驗證計算與通用行為
- 發布日期:2025-03-26 03:36:36+00:00
- 作者:Yury Polyanskiy, Mark Sellke
- 分類:math.ST, stat.ML, stat.TH
- 原文鏈接:http://arxiv.org/abs/2503.20193v1
中文摘要:我們研究一維高斯位置混合模型的非參數最大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知,給定n個數據點時,該估計量總是返回最多含n個分量的混合模型;而近期(Wu-Polyanskiy, 2020)對次高斯數據給出了嚴格的$O(\log n)$界。本文研究$\widehat{\pi}$的計算特性:提出一種算法,當$\varepsilon>0$足夠小時,可在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算Wasserstein距離下的$\varepsilon$近似解,其中$K$與數據相關但與$\varepsilon$無關,$C$為絕對常數,$k=|supp(\widehat{\pi})|\leq n$是$\widehat\pi$的原子數。我們還可在有限時間內確定性計算$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$來自具有(相對於勒貝格測度的)密度的概率分布時,這些保證幾乎必然成立。我們還證明:當$k\leq \sqrt{n}/3$時,限定為k原子型的$\widehat\pi$條件分布在相關$2k-1$維參數空間上存在密度,且EM算法幾乎必然具有局部線性收斂性。關鍵工具之一是非退化曲線的經典傅里葉分析估計。
摘要
- 原文標題:Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
- 中文標題:基於神經網絡原子間勢的聚合物電解質膜質子傳輸大規模長時原子模擬
- 發布日期:2025-03-26 10:40:30+00:00
- 作者:Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文鏈接:http://arxiv.org/abs/2503.20412v1
中文摘要:近年來,機器學習原子間勢能(MLIPs)作為一種能夠實現大規模、長時間原子模擬的方法備受關注,同時保持與基於密度泛函理論(DFT)和從頭算波函數理論的電子結構計算相當的精度。然而,基於MLIP的分子動力學(MD)模擬面臨的一個挑戰是,與使用傳統經典勢能的模擬相比,其穩定性較低。分析高度異質系統或非晶材料通常需要大規模和長時間的模擬,因此需要開發能夠實現穩定MD模擬的魯棒性MLIPs。在本研究中,我們利用神經網絡勢能(NNP)生成器,構建了一個NNP模型,該模型能夠對全氟離子交換膜(Nafion)在不同水合水平下進行大規模、長時間的MD模擬。通過主動學習循環迭代擴展數據集,我們成功構建了一個魯棒的深度勢能(DP)模型。具體而言,通過將非平衡DPMD模擬採樣的非平衡結構與結合最小原子間距離的三維結構特徵空間中的結構篩選相結合,可以顯著增強DP模型的魯棒性,從而實現對約10,000至20,000個原子的大型Nafion系統進行長達31 ns的穩定MD模擬。採用所開發的DP模型進行的MD模擬得到的氫原子自擴散係數,在廣泛的水合水平範圍內,與先前較小系統的從頭算MD模擬相比,更接近實驗值。
摘要
- 原文標題:MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
- 中文標題:MAnycast重裝上陣:開放、快速、可靠且高效的每日任播普查工具
- 發布日期:2025-03-26 13:49:26+00:00
- 作者:Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
- 分類:cs.NI
- 原文鏈接:http://arxiv.org/abs/2503.20554v1
中文摘要:IP任播是一種廣泛採用的技術,通過將地址複製到多個位置來實現(例如降低延遲和增強韌性)。由於任播在現代互聯網中的關鍵作用,先前研究已開發了執行任播普查的工具。首個工具iGreedy利用地理分散位置的延遲測量來繪製任播部署圖;第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——可在3小時內完成全網普查,但存在準確性和精確性問題。相反,iGreedy精度極高但速度較慢,且探測成本更高。 本文針對這兩個系統的缺陷,提出了MAnycast Reloaded(MAnycastR)。我們以MAnycast2為基礎,徹底重構其測量流水線,新增分布式探測支持、額外協議(UDP、TCP和IPv6)支持,以及類似iGreedy的延遲測量功能。通過在含32個全球分布式節點的任播測試平台驗證,與真實任播生產部署對比,並利用RIPE Atlas進行大規模延遲測量,同時對照運營商提供的真實數據交叉核驗超過60%的檢測任播前綴,證明MAnycastR具備高準確性和精確性。我們將持續提供每日MAnycastR普查數據,並以寬鬆開源協議發布工具源代碼。
摘要
- 原文標題:Scalability Evaluation of HPC Multi-GPU Training for ECG-based LLMs
- 中文標題:基於心電圖的大語言模型多GPU訓練的可擴展性評估
- 發布日期:2025-03-26 22:48:17+00:00
- 作者:Dimitar Mileski, Nikola Petrovski, Marjan Gusev
- 分類:cs.DC, C.4; I.6
- 原文鏈接:http://arxiv.org/abs/2503.21033v1
中文摘要:摘要:訓練大型語言模型需要大量計算處理,這依賴於眾多高性能計算資源。本研究比較了多節點與多GPU環境在心電圖大型語言模型訓練中的表現。詳細梳理了當前分布式深度學習框架在多節點和多GPU配置下的應用方案,包括Uber的Horovod、微軟的DeepSpeed,以及PyTorch和TensorFlow的內置分布式功能。針對不同數據集配置,我們對比了多種多GPU方案,獨立利用多個HPC節點,重點關注可擴展性、加速比、效率和開銷。分析採用配備SLURM調度系統、Apptainer(Singularity)容器、CUDA、PyTorch和Shell腳本的HPC基礎設施來支持訓練流程自動化。實驗結果顯示GPU數量擴展時獲得次線性加速比,雙GPU達1.6倍,四GPU達1.9倍。
摘要
- 原文標題:Supply chain network rewiring dynamics at the firm-level
- 中文標題:企業層面的供應鏈網絡重構動態
- 發布日期:2025-03-26 14:42:44+00:00
- 作者:Tobias Reisch, András Borsos, Stefan Thurner
- 分類:econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
- 原文鏈接:http://arxiv.org/abs/2503.20594v1
中文摘要:供應鏈網絡(SCN)構成了任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體,形成了為所有人生產一切的社會新陳代謝系統。供應鏈網絡絕非靜態存在,而是通過企業的進入退出與供應關係的重組持續演變。本文利用獨特數據集研究了一個國家供應鏈網絡中企業及其供應商-採購商關係的時序演化。基於匈牙利2014至2022年按月申報的增值稅數據,我們重建了包含711,248家企業和38,644,400條連接的整體經濟網絡,以企業級分辨率捕捉了整個經濟體幾乎所有的重構事件。研究發現:每年約25%的企業退出供應鏈網絡,同時28%的新企業進入;平均而言,當年存在的供應鏈接中有55%會在次年消失;供應鏈接的半衰期為13個月。新鏈接以超偏好依附概率$p(i)\propto k_i^{1.08}$($k_i$表示企業$i$的供應連接數)附着於企業。我們校準了一個能復現匈牙利主導供應鏈網絡典型特徵的簡易統計網絡生成模型,該模型不僅再現了入/出度分布、同配性和聚類結構等局部網絡特徵,還捕捉到真實的系統性風險特徵。最後探討了經濟重連動態對量化系統韌性和估計衝擊傳導的關鍵作用。
摘要
- 原文標題:The Scalar Size of the Pion from Lattice QCD
- 中文標題:格點QCD計算的π介子標量尺寸
- 發布日期:2025-03-26 16:20:11+00:00
- 作者:Konstantin Ottnad, Georg von Hippel
- 分類:hep-lat, hep-ph
- 原文鏈接:http://arxiv.org/abs/2503.20687v1
中文摘要:我們提出了一種系統誤差完全受控的格點QCD計算,用於確定π介子標量形狀因子及相關半徑。計算結果基於17個規範場組態的大規模集合,採用$N_f=2+1$威爾遜-克拉沃爾改進海夸克。這些組態覆蓋了從$a=0.049\mathrm{fm}$到$a=0.086\mathrm{fm}$四種格距、$130-350\mathrm{MeV}$的π介子質量範圍以及多種物理體積。通過精確計算著名的夸克斷開貢獻,我們在接近物理夸克質量的大尺寸精細組態上,實現了形狀因子前所未有的動量分辨率。採用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$的大範圍源匯間距,可靠地提取了零動量轉移和非零動量轉移下的相關基態矩陣元。這使得我們首次能夠通過所得形狀因子$Q^2$依賴性的$z$展開參數化(而非小動量轉移下的簡單線性近似)來獲取標量半徑。使用三味NLO手征微擾理論對半徑進行物理外推,通過三個低能常數(包括$L_4^r$的首次格點測定)參數化夸克質量依賴性。基於赤池信息準則的模型平均方法,我們系統評估了基態提取、形狀因子參數化以及物理外推對最終結果的系統不確定性。
摘要
- 原文標題:Adaptive Local Clustering over Attributed Graphs
- 中文標題:基於屬性圖的自適應局部聚類
- 發布日期:2025-03-26 12:24:07+00:00
- 作者:Haoran Zheng, Renchi Yang, Jianliang Xu
- 分類:cs.SI, cs.DS, cs.LG
- 原文鏈接:http://arxiv.org/abs/2503.20488v1
中文摘要:給定圖$G$和種子節點$v_s$,局部圖聚類(LGC)的目標是在與$C_s$大小大致成線性關係的時間內,識別出圍繞$v_s$的子圖$C_s$(即局部簇)。這種方法無需訪問整個圖即可生成個性化簇,使其特別適用於涉及大規模圖的應用場景。然而,現有解決方案大多僅依賴圖中節點的拓撲連接關係,容易受到現實圖數據中普遍存在的缺失鏈接或噪聲鏈接的影響。 為解決這一問題,本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息,我們首先將LGC問題建模為雙向擴散分布(BDD)的估計問題,該模型專門用於捕捉帶屬性節點的多跳關聯性。進一步提出LACA方法——一種高效且具備嚴格理論保證的LGC解決方案,其核心組件包括:(i)快速且理論完備的節點屬性預處理技術;(ii)具有理論保證和加速收斂特性的自適應向量擴散算法;(iii)有效的BDD近似三步驟方案。通過在8個真實數據集上與17種對比方法的實驗表明,LACA在真實局部簇的評估指標上全面優於所有對比方法,同時速度提升達數量級。代碼已開源:https://github.com/HaoranZ99/alac。
摘要
- 原文標題:Orbital optimization of large active spaces via AI-accelerators
- 中文標題:基於AI加速器的大活性空間軌道優化
- 發布日期:2025-03-26 16:29:44+00:00
- 作者:Örs Legeza, Andor Menczer, Ádám Ganyecz, Miklós Antal Werner, Kornél Kapás, Jeff Hammond, Sotiris S. Xantheas, Martin Ganahl, Frank Neese
- 分類:physics.chem-ph, cond-mat.str-el
- 原文鏈接:http://arxiv.org/abs/2503.20700v1
中文摘要:我們提出了一種高效的軌道優化方法,該方法將高度GPU加速的自旋適應密度矩陣重整化群(DMRG)方法與ORCA程序包中實現的量子化學完全活性空間自洽場(CAS-SCF)方法相結合。利用最新一代Nvidia GPU硬件的計算能力,我們在包含數千個軌道中數百個電子活性空間尺寸的分子體系中,實現了前所未有的CAS尺寸軌道優化——高達82個電子和82個軌道CAS(82,82)。針對NVIDIA DGX-A100和DGX-H100硬件,我們對多環芳烴和不同尺寸鐵硫配合物基準體系進行了詳細的DMRG-SCF方法擴展性和誤差分析。我們的研究首次證明,在大鍵維度下進行高精度DMRG計算對獲得可靠收斂的CAS-SCF能量至關重要。對於更具挑戰性的鐵硫基準體系,我們還發現收斂CAS-SCF計算的優化軌道對DMRG參數的敏感性高於多環芳烴體系。這種能在數天內獲得如此大尺寸活性空間的收斂CAS-SCF能量和軌道的能力,降低了將適當軌道納入CAS或選擇正確最小CAS的挑戰,可能為處理強關聯分子體系開闢全新途徑。
摘要
- 原文標題:Ion beam treatment of thick polystyrene films
- 中文標題:厚聚苯乙烯薄膜的離子束處理
- 發布日期:2025-03-26 09:39:21+00:00
- 作者:Alexey Kondyurin
- 分類:physics.chem-ph
- 原文鏈接:http://arxiv.org/abs/2503.20359v1
中文摘要:摘要:在硅片上旋塗厚度從78納米至1.3微米不等的聚苯乙烯薄膜,經20 keV氮離子束處理後,橢偏儀測量和傅里葉變換紅外光譜顯示表面改性層與離子在聚合物中的穿透深度(約70納米)相符。然而,深層洗滌及後續測試表明,薄改性層中形成的自由基會遷移至本體層,導致深層聚苯乙烯化學結構發生系列變化。因此,儘管離子在聚苯乙烯膜中的穿透深度有限,整個薄膜的改性深度卻遠超過離子投影射程。這表明離子束處理僅能條件性地視為表面改性方法,必須考慮自由基反應及其向聚合物深層遷移的可能性。
摘要
- 原文標題:Dynamic-OCT simulation framework based on mathematical models of intratissue dynamics, image formation, and measurement noise
- 中文標題:基於組織內動態、成像形成和測量噪聲數學模型的動態OCT仿真框架
- 發布日期:2025-03-26 10:31:16+00:00
- 作者:Yuanke Feng, Shumpei Fujimura, Yiheng Lim, Thitiya Seesan, Rion Morishita, Ibrahim Abd El-Sadek, Pradipta Mukherjee, Shuichi Makita, Yoshiaki Yasuno
- 分類:physics.med-ph, physics.optics
- 原文鏈接:http://arxiv.org/abs/2503.20407v1
中文摘要:動態光學相干斷層掃描(DOCT)通過捕捉由細胞內和組織內運動引起的時間OCT信號變化,實現了無標記功能成像。然而,DOCT信號與其背後樣本運動之間的關係仍不明確。本文提出一個綜合DOCT仿真框架,該框架整合了細胞內/組織內運動的數學模型、兩種從運動散射體模型生成OCT信號時間序列的OCT信號發生器類型,以及代表性DOCT算法。詳細描述了該框架的理論與算法,並通過數值研究驗證了其實用性。該框架已開源,將增進對DOCT的理解和應用價值。
摘要
- 原文標題:Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
- 中文標題:高斯位置混合的非參數最大似然估計:可驗證計算與通用行為
- 發布日期:2025-03-26 03:36:36+00:00
- 作者:Yury Polyanskiy, Mark Sellke
- 分類:math.ST, stat.ML, stat.TH
- 原文鏈接:http://arxiv.org/abs/2503.20193v1
中文摘要:我們研究一維高斯位置混合模型的非參數最大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知,給定n個數據點時,該估計量始終返回最多含n個混合模型的分量;而近期(Wu-Polyanskiy, 2020)對次高斯數據給出了嚴格的$O(\log n)$界。本文研究$\widehat{\pi}$的計算特性:針對足夠小的$\varepsilon>0$,我們提出算法可在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算Wasserstein距離下的$\varepsilon$近似解,其中$K$依賴數據但獨立於$\varepsilon$,$C$為絕對常數,$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子數量。我們還可在有限時間內確定性計算$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$來自具有Lebesgue測度密度的獨立分布時,這些保證幾乎必然成立。同時證明:當$k\leq \sqrt{n}/3$時,限定為k原子結構的$\widehat\pi$條件分布在相應$2k-1$維參數空間上存在密度,且EM算法幾乎必然具有局部線性收斂性。關鍵工具之一是非退化曲線的經典傅里葉分析估計。
摘要
- 原文標題:Search for events with one displaced vertex from long-lived neutral particles decaying into hadronic jets in the ATLAS muon spectrometer in $pp$ collisions at $\sqrt{s}=13$ TeV
- 中文標題:在$\sqrt{s}=13$ TeV的$pp$對撞中ATLASμ子譜儀內長壽命中性粒子衰變為強子噴注產生單位移頂點的事例搜尋
- 發布日期:2025-03-26 11:21:36+00:00
- 作者:ATLAS Collaboration
- 分類:hep-ex
- 原文鏈接:http://arxiv.org/abs/2503.20445v1
中文摘要:摘要:本文報道了利用ATLAS探測器在大型強子對撞機上收集的數據(2015-2018年記錄的140 fb$^{-1}$、$\sqrt{s} = 13$ TeV質子-質子對撞數據)對長壽命中性粒子衰變為強子噴注產生單位移頂點事件的搜尋。該研究採用頂點重建技術,針對μ子譜儀中距主相互作用頂點3米至14米處衰變的長壽命粒子。觀測事件數與預期本底相符,並確定了若干基準信號模型的限制。研究考慮了標量門戶模型和希格斯玻色子門戶重子生成模型,同時設立專用分析通道針對Z玻色子伴隨的長壽命粒子產生過程(包括類軸子粒子和暗光子模型)。對於希格斯玻色子模型,在95%置信水平下排除了長壽命粒子固有衰變長度5厘米至40米範圍內分支比高於1%的情況。對於所研究的避光類軸子粒子模型,本次搜尋對固有衰變長度大於$\mathcal{O}(10)$厘米的情況給出了迄今最強的限制。
摘要
- 原文標題:Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
- 中文標題:基於神經網絡原子勢的聚合物電解質膜質子傳輸大規模長時原子模擬
- 發布日期:2025-03-26 10:40:30+00:00
- 作者:Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
- 分類:cond-mat.mtrl-sci, physics.comp-ph
- 原文鏈接:http://arxiv.org/abs/2503.20412v1
中文摘要:近年來,機器學習原子間勢(MLIPs)作為一種能夠實現大規模、長時間原子尺度模擬的方法,同時保持與基於密度泛函理論(DFT)和從頭算波函數理論的電子結構計算相當的精度,引起了廣泛關注。然而,基於MLIP的分子動力學(MD)模擬面臨的挑戰是其穩定性低於使用傳統經典勢的模擬。分析高度異質體系或非晶材料通常需要大規模和長時間的模擬,因此需要開發能夠實現穩定MD模擬的魯棒MLIP。在本研究中,我們利用神經網絡勢(NNP)生成器,構建了一個NNP模型,能夠在廣泛水合水平範圍內對全氟離聚物膜(Nafion)進行大規模、長時間的MD模擬。通過主動學習循環迭代擴展數據集,我們成功建立了魯棒的深度勢(DP)模型。具體而言,通過將非平衡DPMD模擬採樣的非平衡結構與結合最小原子間距的三維結構特徵空間中的結構篩選相結合,可以顯著增強DP模型的魯棒性,從而實現對約10,000至20,000個原子的大型Nafion體系進行長達31 ns的穩定MD模擬。採用所開發DP模型的MD模擬獲得的氫原子自擴散係數,在廣泛水合水平範圍內與實驗值更為接近,優於先前對小體系進行的從頭算MD模擬結果。
摘要
- 原文標題:MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
- 中文標題:MAnycast重裝上陣:一個開放、快速、可靠且高效的每日任播普查工具
- 發布日期:2025-03-26 13:49:26+00:00
- 作者:Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
- 分類:cs.NI
- 原文鏈接:http://arxiv.org/abs/2503.20554v1
中文摘要:IP任播是一種廣泛採用的技術,通過在多位置複製地址來實現降低延遲和增強韌性等目標。鑑於任播在現代互聯網中的關鍵作用,先前研究已開發了執行任播普查的工具。首個工具iGreedy利用地理分散節點的延遲測量來繪製任播部署圖;第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——可在3小時內完成全網普查,但存在準確性和精確性問題。相反,iGreedy精度極高但速度較慢,且探測成本更高。 本文針對這兩個系統的缺陷提出了MAnycast Reloaded(MAnycastR)。以MAnycast2為基礎,我們徹底重構了其測量流水線,新增分布式探測支持、額外協議(UDP、TCP和IPv6)支持,以及類似iGreedy的延遲測量功能。我們在含32個全球分布式節點的任播測試平台上驗證MAnycastR,與外部任播生產部署進行對比,通過RIPE Atlas進行廣泛延遲測量,並對檢測到的60%以上任播前綴進行運營商數據交叉核驗。結果表明MAnycastR實現了高準確性與精確度。我們將持續提供每日MAnycastR普查數據,並以寬鬆開源協議發布工具源代碼。
摘要
- 原文標題:High-Performance Computational Magnetohydrodynamics with Python
- 中文標題:基於Python的高性能磁流體力學計算
- 發布日期:2025-03-26 18:16:17+00:00
- 作者:Chris Bard, John Dorelli
- 分類:physics.plasm-ph, physics.comp-ph
- 原文鏈接:http://arxiv.org/abs/2503.20899v1
中文摘要:我們推出AGATE模擬代碼,這是一個基於Python開發的框架,主要用於求解磁流體動力學(MHD)方程,同時保持對其他方程組的適應性。該代碼採用模塊化、面向對象的架構,將接口規範與數值實現分離,允許用戶自定義數值方法和物理模型。基於Godunov型有限體積格式構建的AGATE目前支持理想、霍爾及Chew-Goldberger-Low(CGL)三種MHD方程,並提供從Numpy到支持NVIDIA CUDA的GPU計算等多種加速選項。性能測試表明我們的GPU實現相比CPU版本可獲得40-60倍的加速。通過標準基準測試的全面驗證,證實了該代碼能準確再現不同MHD體系下的線性和非線性現象。這種兼具模塊化、高性能和可擴展性的特點,使得AGATE適用於從快速原型開發到生產模擬、從數值算法開發到物理教學等多種應用場景。
摘要
- 原文標題:Supply chain network rewiring dynamics at the firm-level
- 中文標題:企業層面的供應鏈網絡重連動態
- 發布日期:2025-03-26 14:42:44+00:00
- 作者:Tobias Reisch, András Borsos, Stefan Thurner
- 分類:econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
- 原文鏈接:http://arxiv.org/abs/2503.20594v1
中文摘要:供應鏈網絡(SCN)構成了任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體,形成了為所有人生產一切的社會新陳代謝系統。SCN絕非靜態存在,而是通過企業的進出與供應關係的重組持續演變。本研究利用獨特數據集追蹤了一個國家供應鏈網絡中企業及其供需關係的時序演化。基於匈牙利2014至2022年按月申報的增值稅數據,我們重建了包含711,248家企業和38,644,400條連接的整體經濟網絡,實現了企業級分辨率下完整經濟體系重組事件的全面覆蓋。研究發現:每年約25%的企業退出SCN,同時28%的新企業加入;平均55%的年度供應關係會在次年消失;供應關係的半衰期為13個月。新連接以超偏好依附方式鏈接企業,概率滿足$p(i)\propto k_i^{1.08}$($k_i$表示企業i的供應連接數)。我們校準的簡易統計網絡生成模型成功復現了匈牙利主導SCN的典型特徵,不僅匹配入/出度分布、同配性和聚類結構等局部特徵,還能捕捉真實的系統性風險輪廓。該模型揭示了經濟網絡重連動態對量化系統韌性和評估衝擊傳導的關鍵作用。
摘要
- 原文標題:The Scalar Size of the Pion from Lattice QCD
- 中文標題:格點QCD中π介子的標量大小
- 發布日期:2025-03-26 16:20:11+00:00
- 作者:Konstantin Ottnad, Georg von Hippel
- 分類:hep-lat, hep-ph
- 原文鏈接:http://arxiv.org/abs/2503.20687v1
中文摘要:我們提出了一種系統誤差完全受控的格點QCD計算,用於確定π介子標量形狀因子及相關半徑。計算結果基於17個規範場組態的大規模集合,採用$N_f=2+1$威爾遜-克拉沃爾改進海夸克。這些組態覆蓋了從$a=0.049\mathrm{fm}$到$a=0.086\mathrm{fm}$四種格距、$130-350\mathrm{MeV}$的π介子質量範圍以及多種物理體積。通過對著名的夸克斷開貢獻的精確測定,我們首次在接近物理夸克質量的大尺寸精細組態上實現了形狀因子前所未有的動量分辨率。採用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$的大範圍源匯間距,可靠地提取了零動量轉移和非零動量轉移下的相關基態矩陣元。這使得我們首次能夠通過所得形狀因子$Q^2$依賴性的$z$展開參數化(而非小動量轉移下的簡單線性近似)來獲取標量半徑。半徑的物理外推採用三味NLO手征微擾理論,以三個低能常數(包括$L_4^r$的首次格點測定結果)參數化夸克質量依賴性。通過基於赤池信息準則的模型平均方法,系統評估了基態提取、形狀因子參數化以及物理外推對最終結果的系統不確定性影響。
摘要
- 原文標題:Adaptive Local Clustering over Attributed Graphs
- 中文標題:基於屬性圖的自適應局部聚類
- 發布日期:2025-03-26 12:24:07+00:00
- 作者:Haoran Zheng, Renchi Yang, Jianliang Xu
- 分類:cs.SI, cs.DS, cs.LG
- 原文鏈接:http://arxiv.org/abs/2503.20488v1
中文摘要:給定圖$G$和種子節點$v_s$,局部圖聚類(LGC)的目標是在與$C_s$大小大致成線性關係的時間內,識別出圍繞$v_s$的子圖$C_s$(即局部簇)。這種方法無需訪問整個圖即可生成個性化簇,使其特別適用於涉及大規模圖的應用場景。然而現有方案大多僅依賴圖中節點的拓撲連接性,容易受到現實圖數據中普遍存在的缺失或噪聲鏈接的影響。 為解決該問題,本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息,我們首先將LGC建模為雙向擴散分布(BDD)的估計問題,該模型專門用於捕捉含屬性節點的多跳關聯性。進一步提出LACA方法——一種高效且具備強局部性的LGC解決方案,在多個真實數據集上表現出卓越性能。其核心組件包括:(i) 基於理論基礎的快速節點屬性預處理技術;(ii) 具有嚴格理論保證和加速收斂特性的自適應向量擴散算法;(iii) 高效的三步式BDD近似方案。通過在8個真實數據集上與17種對比方法的實驗表明,LACA在真實局部簇標準下的結果質量優於所有對比方法,同時速度可提升數個數量級。代碼已開源:https://github.com/HaoranZ99/alac。
摘要
- 原文標題:Scalability Evaluation of HPC Multi-GPU Training for ECG-based LLMs
- 中文標題:基於心電圖的大語言模型多GPU訓練的可擴展性評估
- 發布日期:2025-03-26 22:48:17+00:00
- 作者:Dimitar Mileski, Nikola Petrovski, Marjan Gusev
- 分類:cs.DC, C.4; I.6
- 原文鏈接:http://arxiv.org/abs/2503.21033v1
中文摘要:摘要:訓練大型語言模型需要大量計算處理,這得益於眾多高性能計算資源的支持。本研究比較了多節點與多GPU環境在心電圖大型語言模型訓練中的表現。詳細梳理了當前分布式深度學習框架在多節點和多GPU配置下的應用方案,包括Uber的Horovod、微軟的DeepSpeed以及PyTorch和TensorFlow的內置分布式功能。針對不同數據集配置,我們對比了多種多GPU方案,獨立利用多個HPC節點,重點關注可擴展性、加速比、效率和開銷。分析過程採用配備SLURM調度系統、Apptainer(Singularity)容器、CUDA、PyTorch和shell腳本的HPC基礎設施來支持訓練工作流和自動化。實驗結果顯示GPU數量擴展時獲得次線性加速比,雙GPU達1.6倍,四GPU達1.9倍。