WikiEdge:ArXiv速遞/2025-03-26

摘要

原文標題：Orbital optimization of large active spaces via AI-accelerators
中文標題：基於AI加速器的大活性空間軌道優化
發布日期：2025-03-26 16:29:44+00:00
作者：Örs Legeza, Andor Menczer, Ádám Ganyecz, Miklós Antal Werner, Kornél Kapás, Jeff Hammond, Sotiris S. Xantheas, Martin Ganahl, Frank Neese
分類：physics.chem-ph, cond-mat.str-el
原文鏈接：http://arxiv.org/abs/2503.20700v1

中文摘要：我們提出了一種高效的軌道優化方法，該方法將高度GPU加速的自旋適應密度矩陣重整化群(DMRG)方法與ORCA程序包中實現的量子化學完全活性空間自洽場(CAS-SCF)方法相結合。利用最新一代Nvidia GPU硬件的計算能力，我們在包含數千個軌道中數百個電子活性空間尺寸的分子體系中，實現了前所未有的CAS尺寸軌道優化——最高達82個電子和82個軌道CAS(82,82)。針對NVIDIA DGX-A100和DGX-H100硬件，我們對多環芳烴和不同尺寸鐵硫複合物構成的基準體系進行了詳細的DMRG-SCF方法縮放和誤差分析。我們的研究首次證明，在大鍵維度下進行高精度 DMRG計算對獲得可靠收斂的CAS-SCF能量至關重要。對於更具挑戰性的鐵硫基準體系，我們還發現收斂CAS-SCF計算的優化軌道對DMRG參數的敏感性高於多環芳烴體系。這種能在數天內獲得如此大尺寸活性空間的收斂CAS-SCF能量和軌道的能力，降低了將適當軌道納入CAS或選擇正確最小CAS的挑戰，可能為解決強關聯分子體系開闢全新途徑。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重構動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會新陳代謝系統。SCN絕非靜態存在，而是通過企業的進出和供應關係的重組持續演變。本研究利用獨特數據集追蹤了一個國家SCN中企業及其供需關係的時間演化。基於匈牙利2014至2022年按月申報的增值稅數據，我們重建了包含711,248家企業和38,644,400條連接的整體經濟網絡，以企業級分辨率捕捉了整個經濟體的每次重構事件。研究發現：每年約25%的企業退出SCN，同時28%的新企業加入；平均55%的年度供應關係會在次年消失；供應關係的半衰期為13個月。新連接以超偏好依附方式鏈接企業，概率滿足$p(i)\propto k_i^{1.08}$（$k_i$表示企業$i$的連接數）。我們校準的簡易統計網絡生成模型成功復現了匈牙利主導SCN的典型特徵，不僅能重現入/出度分布、同配性和聚類結構等局部特徵，還能捕捉真實的系統性風險輪廓。該模型揭示了經濟重連動態對量化系統韌性和估計衝擊傳導的關鍵作用。

摘要

原文標題：The Scalar Size of the Pion from Lattice QCD
中文標題：格點QCD中π介子的標量尺寸
發布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分類：hep-lat, hep-ph
原文鏈接：http://arxiv.org/abs/2503.20687v1

中文摘要：我們提出了一種系統誤差完全受控的格點QCD計算，用於確定π介子標量形狀因子及相關半徑。計算結果基於17個規範系綜的大規模數據集，這些系綜採用$N_f=2+1$威爾遜Clover改進海夸克配置。這些系綜覆蓋了從$a=0.049\mathrm{fm}$到$a=0.086\mathrm{fm}$四種格點間距、$130-350\mathrm{MeV}$的π介子質量範圍以及多種物理體積。通過對著名的夸克斷開貢獻的精確測定，我們首次在接近物理夸克質量的大尺寸精細系綜上實現了形狀因子前所未有的動量分辨率。研究採用了$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$範圍內多種源匯間距，可靠地提取了零動量轉移和非零動量轉移下的相關基態矩陣元。這使得我們能夠首次通過所得形狀因子$Q^2$依賴性的$z$展開參數化（而非小動量轉移下的簡單線性近似）來獲取標量半徑。半徑的物理外推採用三味NLO手征微擾理論，以三個低能常數（包括$L_4^r$的首個格點測定值）來參數化夸克質量依賴性。通過基於赤池信息準則的模型平均方法，我們系統評估了基態提取、形狀因子參數化以及物理外推對最終結果的系統不確定性影響。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：基於屬性圖的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：給定圖$G$和種子節點$v_s$，局部圖聚類（LGC）的目標是在與$C_s$大小近似線性相關的時間內，識別出圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖的應用場景。然而，現有解決方案大多僅依賴圖中節點的拓撲連接性，容易受到現實圖數據中普遍存在的缺失或噪聲鏈接的影響。為解決這一問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC建模為雙向擴散分布（BDD）的估計問題，該模型專門用於捕捉含屬性節點的多跳關聯性。進一步提出LACA方法——一種高效且具備嚴格理論保證的LGC解決方案，其核心包括：(i) 基於理論基礎的快速節點屬性預處理技術；(ii) 具有加速收斂特性的自適應向量擴散算法；(iii) 高效的三步式BDD近似方案。通過在8個真實數據集上與17種方法的對比實驗表明，LACA在真實局部簇的評估指標上全面優於現有方法，同時速度提升達數量級。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：High-Precision Ab Initio Radius Calculations of Boron Isotopes
中文標題：硼同位素高精度從頭算半徑計算
發布日期：2025-03-26 17:50:28+00:00
作者：Tobias Wolfgruber, Tobias Gesser, Marco Knöll, Pieter Maris, Robert Roth
分類：nucl-th
原文鏈接：http://arxiv.org/abs/2503.20764v1

中文摘要：我們採用手征有效場論中的多種現實相互作用對硼同位素半徑進行了精確研究。通過從頭算無核殼模型計算結合機器學習外推方法，我們獲得了具有完整不確定性量化的半徑預測值。進一步擴展到半徑差異研究後，我們得以探究$^{8}$B中可能存在的質子暈現象，並提供了與同位素位移直接相關的預測值——該位移可通過實驗進行精確測量。

摘要

原文標題：Search for events with one displaced vertex from long-lived neutral particles decaying into hadronic jets in the ATLAS muon spectrometer in $pp$ collisions at $\sqrt{s}=13$ TeV
中文標題：在$\sqrt{s}=13$ TeV質子-質子對撞中利用ATLASμ子譜儀尋找長壽命中性粒子衰變為強子噴注的單位移頂點事例
發布日期：2025-03-26 11:21:36+00:00
作者：ATLAS Collaboration
分類：hep-ex
原文鏈接：http://arxiv.org/abs/2503.20445v1

中文摘要：摘要：本文報道了利用大型強子對撞機 ATLAS探測器在2015-2018年收集的140 fb$^{-1}$、質心能量$\sqrt{s}=13$ TeV的質子-質子對撞數據，對長壽命中性粒子衰變為強子噴注並在μ子譜儀中產生位移頂點（距主相互作用頂點3-14米）的事件進行搜尋。觀測到的事件數與預期本底一致，並對若干基準信號模型給出了限制。研究考慮了標量門戶模型和希格斯玻色子門戶重子生成模型，並採用專用分析道針對Z玻色子伴隨產生的長壽命粒子（包括類軸子粒子和暗光子模型）進行探測。對於希格斯玻色子模型，在95%置信水平下排除了長壽命粒子固有衰變長度在5厘米至40米範圍內、分支比高於1%的情況。對於所研究的避光類軸子粒子模型，本次搜尋對固有衰變長度大於$\mathcal{O}(10)$厘米的情況給出了迄今最強的限制。

摘要

原文標題：Ion beam treatment of thick polystyrene films
中文標題：厚聚苯乙烯薄膜的離子束處理
發布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分類：physics.chem-ph
原文鏈接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋塗厚度為78 nm至1.3 μm的聚苯乙烯薄膜經20 keV氮離子束處理後，橢圓偏振測量和FTIR光譜顯示表面改性層與離子在聚合物中的穿透深度（約70 nm）相符。然而，深層洗滌及後續測試表明，薄改性層中形成的自由基會遷移至體層，導致深層聚苯乙烯發生一系列化學結構變化。因此，儘管離子在聚苯乙烯膜中的穿透深度較淺，但整個薄膜的改性深度遠超過離子投射範圍。這表明離子束處理僅能條件性地視為表面改性方法，必須考慮自由基反應及其向聚合物深層遷移的可能性。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數極大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：我們研究一維高斯位置混合模型的非參數最大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定n個數據點時，該估計量總是返回最多含n個分量的混合模型；而近期(Wu-Polyanskiy, 2020)對次高斯數據給出了嚴格的$O(\log n)$界。本文研究$\widehat{\pi}$的計算特性：提出一種算法，當$\varepsilon>0$足夠小時，可在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算Wasserstein距離下的$\varepsilon$近似解，其中$K$與數據相關但與$\varepsilon$無關，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$是$\widehat\pi$的原子數。我們還可在有限時間內確定性計算$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$來自具有(相對於勒貝格測度的)密度的概率分布時，這些保證幾乎必然成立。我們還證明：當$k\leq \sqrt{n}/3$時，限定為k原子型的$\widehat\pi$條件分布在相關$2k-1$維參數空間上存在密度，且EM算法幾乎必然具有局部線性收斂性。關鍵工具之一是非退化曲線的經典傅里葉分析估計。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子間勢的聚合物電解質膜質子傳輸大規模長時原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢能（MLIPs）作為一種能夠實現大規模、長時間原子模擬的方法備受關注，同時保持與基於密度泛函理論（DFT）和從頭算波函數理論的電子結構計算相當的精度。然而，基於MLIP的分子動力學（MD）模擬面臨的一個挑戰是，與使用傳統經典勢能的模擬相比，其穩定性較低。分析高度異質系統或非晶材料通常需要大規模和長時間的模擬，因此需要開發能夠實現穩定MD模擬的魯棒性MLIPs。在本研究中，我們利用神經網絡勢能（NNP）生成器，構建了一個NNP模型，該模型能夠對全氟離子交換膜（Nafion）在不同水合水平下進行大規模、長時間的MD模擬。通過主動學習循環迭代擴展數據集，我們成功構建了一個魯棒的深度勢能（DP）模型。具體而言，通過將非平衡DPMD模擬採樣的非平衡結構與結合最小原子間距離的三維結構特徵空間中的結構篩選相結合，可以顯著增強DP模型的魯棒性，從而實現對約10,000至20,000個原子的大型Nafion系統進行長達31 ns的穩定MD模擬。採用所開發的DP模型進行的MD模擬得到的氫原子自擴散係數，在廣泛的水合水平範圍內，與先前較小系統的從頭算MD模擬相比，更接近實驗值。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：開放、快速、可靠且高效的每日任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過將地址複製到多個位置來實現（例如降低延遲和增強韌性）。由於任播在現代互聯網中的關鍵作用，先前研究已開發了執行任播普查的工具。首個工具iGreedy利用地理分散位置的延遲測量來繪製任播部署圖；第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——可在3小時內完成全網普查，但存在準確性和精確性問題。相反，iGreedy精度極高但速度較慢，且探測成本更高。本文針對這兩個系統的缺陷，提出了MAnycast Reloaded（MAnycastR）。我們以MAnycast2為基礎，徹底重構其測量流水線，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持，以及類似iGreedy的延遲測量功能。通過在含32個全球分布式節點的任播測試平台驗證，與真實任播生產部署對比，並利用RIPE Atlas進行大規模延遲測量，同時對照運營商提供的真實數據交叉核驗超過60%的檢測任播前綴，證明MAnycastR具備高準確性和精確性。我們將持續提供每日MAnycastR普查數據，並以寬鬆開源協議發布工具源代碼。

摘要

原文標題：Scalability Evaluation of HPC Multi-GPU Training for ECG-based LLMs
中文標題：基於心電圖的大語言模型多GPU訓練的可擴展性評估
發布日期：2025-03-26 22:48:17+00:00
作者：Dimitar Mileski, Nikola Petrovski, Marjan Gusev
分類：cs.DC, C.4; I.6
原文鏈接：http://arxiv.org/abs/2503.21033v1

中文摘要：摘要：訓練大型語言模型需要大量計算處理，這依賴於眾多高性能計算資源。本研究比較了多節點與多GPU環境在心電圖大型語言模型訓練中的表現。詳細梳理了當前分布式深度學習框架在多節點和多GPU配置下的應用方案，包括Uber的Horovod、微軟的DeepSpeed，以及PyTorch和TensorFlow的內置分布式功能。針對不同數據集配置，我們對比了多種多GPU方案，獨立利用多個HPC節點，重點關注可擴展性、加速比、效率和開銷。分析採用配備SLURM調度系統、Apptainer（Singularity）容器、CUDA、PyTorch和Shell腳本的HPC基礎設施來支持訓練流程自動化。實驗結果顯示GPU數量擴展時獲得次線性加速比，雙GPU達1.6倍，四GPU達1.9倍。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重構動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成了任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會新陳代謝系統。供應鏈網絡絕非靜態存在，而是通過企業的進入退出與供應關係的重組持續演變。本文利用獨特數據集研究了一個國家供應鏈網絡中企業及其供應商-採購商關係的時序演化。基於匈牙利2014至2022年按月申報的增值稅數據，我們重建了包含711,248家企業和38,644,400條連接的整體經濟網絡，以企業級分辨率捕捉了整個經濟體幾乎所有的重構事件。研究發現：每年約25%的企業退出供應鏈網絡，同時28%的新企業進入；平均而言，當年存在的供應鏈接中有55%會在次年消失；供應鏈接的半衰期為13個月。新鏈接以超偏好依附概率$p(i)\propto k_i^{1.08}$（$k_i$表示企業$i$的供應連接數）附着於企業。我們校準了一個能復現匈牙利主導供應鏈網絡典型特徵的簡易統計網絡生成模型，該模型不僅再現了入/出度分布、同配性和聚類結構等局部網絡特徵，還捕捉到真實的系統性風險特徵。最後探討了經濟重連動態對量化系統韌性和估計衝擊傳導的關鍵作用。

摘要

原文標題：The Scalar Size of the Pion from Lattice QCD
中文標題：格點QCD計算的π介子標量尺寸
發布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分類：hep-lat, hep-ph
原文鏈接：http://arxiv.org/abs/2503.20687v1

中文摘要：我們提出了一種系統誤差完全受控的格點QCD計算，用於確定π介子標量形狀因子及相關半徑。計算結果基於17個規範場組態的大規模集合，採用$N_f=2+1$威爾遜-克拉沃爾改進海夸克。這些組態覆蓋了從$a=0.049\mathrm{fm}$到$a=0.086\mathrm{fm}$四種格距、$130-350\mathrm{MeV}$的π介子質量範圍以及多種物理體積。通過精確計算著名的夸克斷開貢獻，我們在接近物理夸克質量的大尺寸精細組態上，實現了形狀因子前所未有的動量分辨率。採用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$的大範圍源匯間距，可靠地提取了零動量轉移和非零動量轉移下的相關基態矩陣元。這使得我們首次能夠通過所得形狀因子$Q^2$依賴性的$z$展開參數化（而非小動量轉移下的簡單線性近似）來獲取標量半徑。使用三味NLO手征微擾理論對半徑進行物理外推，通過三個低能常數（包括$L_4^r$的首次格點測定）參數化夸克質量依賴性。基於赤池信息準則的模型平均方法，我們系統評估了基態提取、形狀因子參數化以及物理外推對最終結果的系統不確定性。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：基於屬性圖的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：給定圖$G$和種子節點$v_s$，局部圖聚類(LGC)的目標是在與$C_s$大小大致成線性關係的時間內，識別出圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖的應用場景。然而，現有解決方案大多僅依賴圖中節點的拓撲連接關係，容易受到現實圖數據中普遍存在的缺失鏈接或噪聲鏈接的影響。為解決這一問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC問題建模為雙向擴散分布(BDD)的估計問題，該模型專門用於捕捉帶屬性節點的多跳關聯性。進一步提出LACA方法——一種高效且具備嚴格理論保證的LGC解決方案，其核心組件包括：(i)快速且理論完備的節點屬性預處理技術；(ii)具有理論保證和加速收斂特性的自適應向量擴散算法；(iii)有效的BDD近似三步驟方案。通過在8個真實數據集上與17種對比方法的實驗表明，LACA在真實局部簇的評估指標上全面優於所有對比方法，同時速度提升達數量級。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：Orbital optimization of large active spaces via AI-accelerators
中文標題：基於AI加速器的大活性空間軌道優化
發布日期：2025-03-26 16:29:44+00:00
作者：Örs Legeza, Andor Menczer, Ádám Ganyecz, Miklós Antal Werner, Kornél Kapás, Jeff Hammond, Sotiris S. Xantheas, Martin Ganahl, Frank Neese
分類：physics.chem-ph, cond-mat.str-el
原文鏈接：http://arxiv.org/abs/2503.20700v1

中文摘要：我們提出了一種高效的軌道優化方法，該方法將高度GPU加速的自旋適應密度矩陣重整化群(DMRG)方法與ORCA程序包中實現的量子化學完全活性空間自洽場(CAS-SCF)方法相結合。利用最新一代Nvidia GPU硬件的計算能力，我們在包含數千個軌道中數百個電子活性空間尺寸的分子體系中，實現了前所未有的CAS尺寸軌道優化——高達82個電子和82個軌道CAS(82,82)。針對NVIDIA DGX-A100和DGX-H100硬件，我們對多環芳烴和不同尺寸鐵硫配合物基準體系進行了詳細的DMRG-SCF方法擴展性和誤差分析。我們的研究首次證明，在大鍵維度下進行高精度 DMRG計算對獲得可靠收斂的CAS-SCF能量至關重要。對於更具挑戰性的鐵硫基準體系，我們還發現收斂CAS-SCF計算的優化軌道對DMRG參數的敏感性高於多環芳烴體系。這種能在數天內獲得如此大尺寸活性空間的收斂CAS-SCF能量和軌道的能力，降低了將適當軌道納入CAS或選擇正確最小CAS的挑戰，可能為處理強關聯分子體系開闢全新途徑。

摘要

原文標題：Ion beam treatment of thick polystyrene films
中文標題：厚聚苯乙烯薄膜的離子束處理
發布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分類：physics.chem-ph
原文鏈接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋塗厚度從78納米至1.3微米不等的聚苯乙烯薄膜，經20 keV氮離子束處理後，橢偏儀測量和傅里葉變換紅外光譜顯示表面改性層與離子在聚合物中的穿透深度（約70納米）相符。然而，深層洗滌及後續測試表明，薄改性層中形成的自由基會遷移至本體層，導致深層聚苯乙烯化學結構發生系列變化。因此，儘管離子在聚苯乙烯膜中的穿透深度有限，整個薄膜的改性深度卻遠超過離子投影射程。這表明離子束處理僅能條件性地視為表面改性方法，必須考慮自由基反應及其向聚合物深層遷移的可能性。

摘要

原文標題：Dynamic-OCT simulation framework based on mathematical models of intratissue dynamics, image formation, and measurement noise
中文標題：基於組織內動態、成像形成和測量噪聲數學模型的動態OCT仿真框架
發布日期：2025-03-26 10:31:16+00:00
作者：Yuanke Feng, Shumpei Fujimura, Yiheng Lim, Thitiya Seesan, Rion Morishita, Ibrahim Abd El-Sadek, Pradipta Mukherjee, Shuichi Makita, Yoshiaki Yasuno
分類：physics.med-ph, physics.optics
原文鏈接：http://arxiv.org/abs/2503.20407v1

中文摘要：動態光學相干斷層掃描（DOCT）通過捕捉由細胞內和組織內運動引起的時間 OCT信號變化，實現了無標記功能成像。然而，DOCT信號與其背後樣本運動之間的關係仍不明確。本文提出一個綜合DOCT仿真框架，該框架整合了細胞內/組織內運動的數學模型、兩種從運動散射體模型生成OCT信號時間序列的OCT信號發生器類型，以及代表性DOCT算法。詳細描述了該框架的理論與算法，並通過數值研究驗證了其實用性。該框架已開源，將增進對DOCT的理解和應用價值。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數最大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：我們研究一維高斯位置混合模型的非參數最大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定n個數據點時，該估計量始終返回最多含n個混合模型的分量；而近期(Wu-Polyanskiy, 2020)對次高斯數據給出了嚴格的$O(\log n)$界。本文研究$\widehat{\pi}$的計算特性：針對足夠小的$\varepsilon>0$，我們提出算法可在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算Wasserstein距離下的$\varepsilon$近似解，其中$K$依賴數據但獨立於$\varepsilon$，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子數量。我們還可在有限時間內確定性計算$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$來自具有Lebesgue測度密度的獨立分布時，這些保證幾乎必然成立。同時證明：當$k\leq \sqrt{n}/3$時，限定為k原子結構的$\widehat\pi$條件分布在相應$2k-1$維參數空間上存在密度，且EM算法幾乎必然具有局部線性收斂性。關鍵工具之一是非退化曲線的經典傅里葉分析估計。

摘要

原文標題：Search for events with one displaced vertex from long-lived neutral particles decaying into hadronic jets in the ATLAS muon spectrometer in $pp$ collisions at $\sqrt{s}=13$ TeV
中文標題：在$\sqrt{s}=13$ TeV的$pp$對撞中ATLASμ子譜儀內長壽命中性粒子衰變為強子噴注產生單位移頂點的事例搜尋
發布日期：2025-03-26 11:21:36+00:00
作者：ATLAS Collaboration
分類：hep-ex
原文鏈接：http://arxiv.org/abs/2503.20445v1

中文摘要：摘要：本文報道了利用ATLAS探測器在大型強子對撞機上收集的數據（2015-2018年記錄的140 fb$^{-1}$、$\sqrt{s} = 13$ TeV質子-質子對撞數據）對長壽命中性粒子衰變為強子噴注產生單位移頂點事件的搜尋。該研究採用頂點重建技術，針對μ子譜儀中距主相互作用頂點3米至14米處衰變的長壽命粒子。觀測事件數與預期本底相符，並確定了若干基準信號模型的限制。研究考慮了標量門戶模型和希格斯玻色子門戶重子生成模型，同時設立專用分析通道針對Z玻色子伴隨的長壽命粒子產生過程（包括類軸子粒子和暗光子模型）。對於希格斯玻色子模型，在95%置信水平下排除了長壽命粒子固有衰變長度5厘米至40米範圍內分支比高於1%的情況。對於所研究的避光類軸子粒子模型，本次搜尋對固有衰變長度大於$\mathcal{O}(10)$厘米的情況給出了迄今最強的限制。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子勢的聚合物電解質膜質子傳輸大規模長時原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢（MLIPs）作為一種能夠實現大規模、長時間原子尺度模擬的方法，同時保持與基於密度泛函理論（DFT）和從頭算波函數理論的電子結構計算相當的精度，引起了廣泛關注。然而，基於MLIP的分子動力學（MD）模擬面臨的挑戰是其穩定性低於使用傳統經典勢的模擬。分析高度異質體系或非晶材料通常需要大規模和長時間的模擬，因此需要開發能夠實現穩定MD模擬的魯棒MLIP。在本研究中，我們利用神經網絡勢（NNP）生成器，構建了一個NNP模型，能夠在廣泛水合水平範圍內對全氟離聚物膜（Nafion）進行大規模、長時間的MD模擬。通過主動學習循環迭代擴展數據集，我們成功建立了魯棒的深度勢（DP）模型。具體而言，通過將非平衡DPMD模擬採樣的非平衡結構與結合最小原子間距的三維結構特徵空間中的結構篩選相結合，可以顯著增強DP模型的魯棒性，從而實現對約10,000至20,000個原子的大型Nafion體系進行長達31 ns的穩定MD模擬。採用所開發DP模型的MD模擬獲得的氫原子自擴散係數，在廣泛水合水平範圍內與實驗值更為接近，優於先前對小體系進行的從頭算MD模擬結果。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：一個開放、快速、可靠且高效的每日任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過在多位置複製地址來實現降低延遲和增強韌性等目標。鑑於任播在現代互聯網中的關鍵作用，先前研究已開發了執行任播普查的工具。首個工具iGreedy利用地理分散節點的延遲測量來繪製任播部署圖；第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——可在3小時內完成全網普查，但存在準確性和精確性問題。相反，iGreedy精度極高但速度較慢，且探測成本更高。本文針對這兩個系統的缺陷提出了MAnycast Reloaded（MAnycastR）。以MAnycast2為基礎，我們徹底重構了其測量流水線，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持，以及類似iGreedy的延遲測量功能。我們在含32個全球分布式節點的任播測試平台上驗證MAnycastR，與外部任播生產部署進行對比，通過RIPE Atlas進行廣泛延遲測量，並對檢測到的60%以上任播前綴進行運營商數據交叉核驗。結果表明MAnycastR實現了高準確性與精確度。我們將持續提供每日MAnycastR普查數據，並以寬鬆開源協議發布工具源代碼。

摘要

原文標題：High-Performance Computational Magnetohydrodynamics with Python
中文標題：基於Python的高性能磁流體力學計算
發布日期：2025-03-26 18:16:17+00:00
作者：Chris Bard, John Dorelli
分類：physics.plasm-ph, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20899v1

中文摘要：我們推出AGATE模擬代碼，這是一個基於Python開發的框架，主要用於求解磁流體動力學(MHD)方程，同時保持對其他方程組的適應性。該代碼採用模塊化、面向對象的架構，將接口規範與數值實現分離，允許用戶自定義數值方法和物理模型。基於Godunov型有限體積格式構建的AGATE目前支持理想、霍爾及Chew-Goldberger-Low(CGL)三種MHD方程，並提供從Numpy到支持NVIDIA CUDA的GPU計算等多種加速選項。性能測試表明我們的GPU實現相比CPU版本可獲得40-60倍的加速。通過標準基準測試的全面驗證，證實了該代碼能準確再現不同MHD體系下的線性和非線性現象。這種兼具模塊化、高性能和可擴展性的特點，使得AGATE適用於從快速原型開發到生產模擬、從數值算法開發到物理教學等多種應用場景。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重連動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成了任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會新陳代謝系統。SCN絕非靜態存在，而是通過企業的進出與供應關係的重組持續演變。本研究利用獨特數據集追蹤了一個國家供應鏈網絡中企業及其供需關係的時序演化。基於匈牙利2014至2022年按月申報的增值稅數據，我們重建了包含711,248家企業和38,644,400條連接的整體經濟網絡，實現了企業級分辨率下完整經濟體系重組事件的全面覆蓋。研究發現：每年約25%的企業退出SCN，同時28%的新企業加入；平均55%的年度供應關係會在次年消失；供應關係的半衰期為13個月。新連接以超偏好依附方式鏈接企業，概率滿足$p(i)\propto k_i^{1.08}$（$k_i$表示企業i的供應連接數）。我們校準的簡易統計網絡生成模型成功復現了匈牙利主導SCN的典型特徵，不僅匹配入/出度分布、同配性和聚類結構等局部特徵，還能捕捉真實的系統性風險輪廓。該模型揭示了經濟網絡重連動態對量化系統韌性和評估衝擊傳導的關鍵作用。

摘要

原文標題：The Scalar Size of the Pion from Lattice QCD
中文標題：格點QCD中π介子的標量大小
發布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分類：hep-lat, hep-ph
原文鏈接：http://arxiv.org/abs/2503.20687v1

中文摘要：我們提出了一種系統誤差完全受控的格點QCD計算，用於確定π介子標量形狀因子及相關半徑。計算結果基於17個規範場組態的大規模集合，採用$N_f=2+1$威爾遜-克拉沃爾改進海夸克。這些組態覆蓋了從$a=0.049\mathrm{fm}$到$a=0.086\mathrm{fm}$四種格距、$130-350\mathrm{MeV}$的π介子質量範圍以及多種物理體積。通過對著名的夸克斷開貢獻的精確測定，我們首次在接近物理夸克質量的大尺寸精細組態上實現了形狀因子前所未有的動量分辨率。採用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$的大範圍源匯間距，可靠地提取了零動量轉移和非零動量轉移下的相關基態矩陣元。這使得我們首次能夠通過所得形狀因子$Q^2$依賴性的$z$展開參數化（而非小動量轉移下的簡單線性近似）來獲取標量半徑。半徑的物理外推採用三味NLO手征微擾理論，以三個低能常數（包括$L_4^r$的首次格點測定結果）參數化夸克質量依賴性。通過基於赤池信息準則的模型平均方法，系統評估了基態提取、形狀因子參數化以及物理外推對最終結果的系統不確定性影響。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：基於屬性圖的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：給定圖$G$和種子節點$v_s$，局部圖聚類（LGC）的目標是在與$C_s$大小大致成線性關係的時間內，識別出圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖的應用場景。然而現有方案大多僅依賴圖中節點的拓撲連接性，容易受到現實圖數據中普遍存在的缺失或噪聲鏈接的影響。為解決該問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC建模為雙向擴散分布（BDD）的估計問題，該模型專門用於捕捉含屬性節點的多跳關聯性。進一步提出LACA方法——一種高效且具備強局部性的LGC解決方案，在多個真實數據集上表現出卓越性能。其核心組件包括：(i) 基於理論基礎的快速節點屬性預處理技術；(ii) 具有嚴格理論保證和加速收斂特性的自適應向量擴散算法；(iii) 高效的三步式BDD近似方案。通過在8個真實數據集上與17種對比方法的實驗表明，LACA在真實局部簇標準下的結果質量優於所有對比方法，同時速度可提升數個數量級。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：Scalability Evaluation of HPC Multi-GPU Training for ECG-based LLMs
中文標題：基於心電圖的大語言模型多GPU訓練的可擴展性評估
發布日期：2025-03-26 22:48:17+00:00
作者：Dimitar Mileski, Nikola Petrovski, Marjan Gusev
分類：cs.DC, C.4; I.6
原文鏈接：http://arxiv.org/abs/2503.21033v1

中文摘要：摘要：訓練大型語言模型需要大量計算處理，這得益於眾多高性能計算資源的支持。本研究比較了多節點與多GPU環境在心電圖大型語言模型訓練中的表現。詳細梳理了當前分布式深度學習框架在多節點和多GPU配置下的應用方案，包括Uber的Horovod、微軟的DeepSpeed以及PyTorch和TensorFlow的內置分布式功能。針對不同數據集配置，我們對比了多種多GPU方案，獨立利用多個HPC節點，重點關注可擴展性、加速比、效率和開銷。分析過程採用配備SLURM調度系統、Apptainer（Singularity）容器、CUDA、PyTorch和shell腳本的HPC基礎設施來支持訓練工作流和自動化。實驗結果顯示GPU數量擴展時獲得次線性加速比，雙GPU達1.6倍，四GPU達1.9倍。

摘要

原文標題：Ion beam treatment of thick polystyrene films
中文標題：厚聚苯乙烯薄膜的離子束處理
發布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分類：physics.chem-ph
原文鏈接：http://arxiv.org/abs/2503.20359v1

中文摘要：在硅片上旋塗厚度從78納米至1.3微米不等的聚苯乙烯薄膜，經20 keV 氮離子束處理後，橢偏儀測量和傅里葉變換紅外光譜顯示表面改性層深度與離子在聚合物中的穿透深度（約70納米）相符。然而，深層洗滌及後續測試表明：薄改性層中形成的自由基會遷移至體層，導致聚苯乙烯深層化學結構發生系列變化。因此，儘管離子在聚苯乙烯膜中的穿透深度較淺，但整個薄膜的改性深度遠超離子投影射程。這表明離子束處理僅能條件性地視為表面改性方法，必須考慮自由基反應及其向聚合物深層遷移的可能性。

摘要

原文標題：Orbital optimization of large active spaces via AI-accelerators
中文標題：基於AI加速器的大活性空間軌道優化
發布日期：2025-03-26 16:29:44+00:00
作者：Örs Legeza, Andor Menczer, Ádám Ganyecz, Miklós Antal Werner, Kornél Kapás, Jeff Hammond, Sotiris S. Xantheas, Martin Ganahl, Frank Neese
分類：physics.chem-ph, cond-mat.str-el
原文鏈接：http://arxiv.org/abs/2503.20700v1

中文摘要：我們提出了一種高效的軌道優化方法，該方法將高度GPU加速的自旋適應密度矩陣重整化群(DMRG)方法與ORCA程序包中實現的量子化學完全活性空間自洽場(CAS-SCF)方法相結合。利用最新一代Nvidia GPU硬件的計算能力，我們在包含數千個軌道中數百個電子活性空間尺寸的分子體系中，實現了前所未有的CAS尺寸軌道優化——最高達82個電子和82個軌道CAS(82,82)。針對NVIDIA DGX-A100和DGX-H100硬件，我們對多環芳烴和不同尺寸鐵硫複合物構成的基準體系進行了詳細的DMRG-SCF方法縮放和誤差分析。我們的研究首次證明，在大鍵維度下進行高精度 DMRG計算對於獲得可靠收斂的CAS-SCF能量至關重要。對於更具挑戰性的鐵硫基準體系，我們還發現收斂CAS-SCF計算的優化軌道對DMRG參數的敏感性高於多環芳烴體系。這種能在數天內獲得如此大尺寸活性空間的收斂CAS-SCF能量和軌道的能力，降低了將適當軌道納入CAS或選擇正確最小CAS的挑戰，可能為處理強關聯分子體系開闢全新途徑。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數極大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：我們研究一維高斯位置混合模型的非參數極大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定n個數據點時，該估計量總是返回最多含n個分量的混合模型；而近期(Wu-Polyanskiy, 2020)對次高斯數據給出了精確的$O(\log n)$界。本文研究$\widehat{\pi}$的計算特性：我們提出一種算法，當$\varepsilon>0$足夠小時，可在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算得到$\widehat\pi$的Wasserstein距離$\varepsilon$-近似解。其中$K$與數據相關但獨立於$\varepsilon$，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子數量。我們還可在有限時間內確定性計算$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$中的點獨立採樣自具有Lebesgue測度密度的概率分布時，這些保證幾乎必然成立。我們還證明：當$\widehat\pi$被約束為k原子分布時，其在$2k-1$維參數空間上存在密度（對所有$k\leq \sqrt{n}/3$成立），且EM算法幾乎必然具有局部線性收斂性。關鍵工具之一是對非退化曲線的經典傅里葉分析估計。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子間勢的聚合物電解質膜質子傳輸大規模長時原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢（MLIPs）作為一種能夠實現大規模、長時間原子尺度模擬的方法備受關注，同時保持與基於密度泛函理論（DFT）和從頭算波函數理論的電子結構計算相當的精度。然而，基於MLIP的分子動力學（MD）模擬面臨的一個挑戰是，與傳統經典勢函數相比其穩定性較低。分析高度異質體系或非晶材料通常需要大規模和長時間的模擬，因此需要開發能夠實現穩定MD模擬的魯棒性 MLIPs。在本研究中，我們利用自研的神經網絡勢（NNP）生成器，構建了一個NNP模型，能夠對全氟離聚物膜（Nafion）在不同水合水平下進行大規模、長時間的MD模擬。通過主動學習循環迭代擴展數據集，我們成功建立了魯棒的深度勢（DP）模型。具體而言，通過將非平衡 DPMD模擬採樣的非平衡結構與結合最小原子間距的三維結構特徵空間中的結構篩選相結合，可顯著提升DP模型的魯棒性，從而實現對約10,000至20,000個原子的大型Nafion體系進行長達31 ns的穩定MD模擬。採用所開發DP模型的MD模擬獲得的氫原子自擴散係數，在廣泛水合水平範圍內比先前小體系從頭算 MD模擬結果更接近實驗值。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：開放、快速、可靠且高效的每日任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過在多位置複製地址來實現降低延遲、增強韌性等目標。鑑於任播在現代互聯網中的關鍵作用，先前研究已開發了多種任播普查工具。首款工具iGreedy通過地理分散的延遲測量來繪製任播部署圖；第二款工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——僅需3小時即可完成全網普查，但存在準確性和精確度問題。反之，iGreedy精度極高但速度較慢，且探測成本更高。本文針對這兩個系統的缺陷，提出了升級版MAnycast Reloaded（MAnycastR）。以MAnycast2為基礎，我們徹底重構了其測量管道，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持以及類似iGreedy的延遲測量功能。通過在含32個全球分布式節點的任播測試床上驗證，與真實任播生產部署對比，並利用RIPE Atlas進行大規模延遲測量，同時對照運營商提供的真實數據核驗了60%以上檢測到的任播前綴，證明MAnycastR具備高準確性與精確度。我們將持續提供每日更新的MAnycastR普查數據，並以寬鬆開源協議發布工具源代碼。

摘要

原文標題：Flow of a two-dimensional liquid foam: Impact of surfactant type and boundary conditions
中文標題：二維液體泡沫的流動：表面活性劑類型和邊界條件的影響
發布日期：2025-03-26 16:44:40+00:00
作者：Farshad Nazari, Andrei Potanin, Hadi Mohammadigoushki
分類：cond-mat.soft, physics.flu-dyn
原文鏈接：http://arxiv.org/abs/2503.20710v1

中文摘要：本研究通過實驗探究了二維單分散水基泡沫在平行板間剪切時的流變與流動行為，採用自製光流變儀（配備光滑/粗糙壁面）進行測試。使用兩種市售洗滌劑（Foam 1和Foam 2）製備泡沫，保持氣泡尺寸和液相分數一致。線性粘彈性結果表明：無論邊界條件如何，Foam 1始終表現出比Foam 2更高的彈性模量和損耗模量，且粗糙壁面會進一步強化兩種泡沫的模量。此外，Foam 1的粘彈性弛豫頻率較低，表明其界面流動性較弱。在非線性區域觀察到顯著差異：光滑邊界條件下，Foam 2呈現屈服應力特性而Foam 1未出現，儘管後者具有更高的粘性應力。Foam 1的粘性應力與毛細數呈標度關係，而Foam 2的標度行為依邊界條件（光滑/粗糙壁面）呈現差異。這些流變行為差異源於表面活性劑化學性質不同導致的界面流動性差異，其中Foam 1的界面流動性低於Foam 2。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重連動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會新陳代謝系統。SCN絕非靜態存在，而是通過企業的進出與供應關係的重組持續演變。本文利用獨特數據集研究了一個國家SCN中企業及其供應商-客戶關係的時間演化。基於匈牙利2014至2022年每月報告的增值稅數據，我們重建了包含711,248家企業和38,644,400條連接的完整經濟網絡，以企業級分辨率覆蓋了整個經濟體的幾乎所有重構事件。研究發現：每年約25%的企業退出SCN，同時28%的新企業加入；平均55%的現存供應鏈接會在次年消失；供應鏈接的半衰期為13個月。新鏈接以超偏好依附方式連接企業，概率滿足$p(i)\propto k_i^{1.08}$（$k_i$表示企業$i$的供應連接數）。我們校準了一個能復現匈牙利主導SCN典型特徵的簡單統計網絡生成模型，該模型不僅再現了入/出度分布、同配性和聚類結構等局部網絡特徵，還捕捉了真實的系統性風險輪廓。最後討論了當前模型如何通過經濟重連動態來量化系統韌性及評估衝擊傳導。

摘要

原文標題：The Scalar Size of the Pion from Lattice QCD
中文標題：π介子標量尺寸的格點QCD研究
發布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分類：hep-lat, hep-ph
原文鏈接：http://arxiv.org/abs/2503.20687v1

中文摘要：我們提出了一種系統誤差完全受控的格點QCD計算，用於確定π介子標量形狀因子及相關半徑。計算結果基於17個規範系綜的大規模數據集，這些系綜採用$N_f=2+1$威爾遜Clover改進海夸克配置，涵蓋$0.049\mathrm{fm}$至$0.086\mathrm{fm}$四種格距、$130-350\mathrm{MeV}$的π介子質量範圍及多種物理體積。通過對棘手夸克斷開貢獻的精確測定，我們在接近物理夸克質量的大尺寸精細系綜上實現了形狀因子前所未有的動量分辨率。採用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$的大範圍源匯間距，可靠地提取了零動量轉移與非零動量轉移下的基態矩陣元。這使得我們首次能通過所得形狀因子$Q^2$依賴性的$z$展開參數化（而非小動量轉移下的簡單線性近似）獲取標量半徑。物理外推採用三味NLO手征微擾理論，以三個低能常數（包括$L_4^r$的首個格點測定值）參數化夸克質量依賴性。通過基於赤池信息準則的模型平均方法，系統評估了基態提取、形狀因子參數化及物理外推對最終結果的系統不確定性。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：基於屬性圖的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：給定圖$G$和種子節點$v_s$，局部圖聚類（LGC）的目標是在與$C_s$大小大致成線性關係的時間內，識別出圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖的應用場景。然而，現有解決方案大多僅依賴圖中節點的拓撲連接關係，容易受到現實圖數據中普遍存在的缺失或噪聲鏈接的影響。為解決該問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC建模為雙向擴散分布（BDD）的估計問題，該模型專門用於捕捉帶屬性節點的多跳關聯性。進一步提出LACA方法——一種高效且具備嚴格理論保證的LGC方案，其核心組件包括：(i) 基於理論基礎的快速節點屬性預處理技術；(ii) 具有自適應擴散能力和加速收斂特性的向量傳播算法；(iii) 高效的三步式BDD近似策略。在8個真實數據集上與17種基線方法的對比實驗表明，LACA在真實局部簇的評估指標上全面優於所有對比方法，同時速度提升達數量級。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：Scalability Evaluation of HPC Multi-GPU Training for ECG-based LLMs
中文標題：基於心電圖的大語言模型多GPU訓練的可擴展性評估
發布日期：2025-03-26 22:48:17+00:00
作者：Dimitar Mileski, Nikola Petrovski, Marjan Gusev
分類：cs.DC, C.4; I.6
原文鏈接：http://arxiv.org/abs/2503.21033v1

中文摘要：摘要：訓練大型語言模型需要大量計算處理，這依賴於眾多高性能計算資源。本研究比較了多節點與多GPU環境在心電圖大型語言模型訓練中的表現。詳細梳理了當前分布式深度學習框架在多節點和多GPU配置下的應用方案，包括Uber的Horovod、微軟的DeepSpeed，以及PyTorch和TensorFlow的內置分布式功能。針對不同數據集配置，我們對比了多種多GPU方案，獨立利用多個HPC節點，重點關注可擴展性、加速比、效率和開銷。分析過程採用配備SLURM調度系統、Apptainer（Singularity）容器、CUDA、PyTorch和shell腳本的HPC基礎設施來支持訓練工作流和自動化。實驗結果顯示GPU數量擴展時獲得次線性加速比：雙GPU達1.6倍，四GPU達1.9倍。

摘要

原文標題：Ion beam treatment of thick polystyrene films
中文標題：厚聚苯乙烯薄膜的離子束處理
發布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分類：physics.chem-ph
原文鏈接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋塗厚度從78納米至1.3微米不等的聚苯乙烯薄膜，經20 keV氮離子束處理後，橢偏儀測量和傅里葉變換紅外光譜顯示表面改性層深度與離子在聚合物中的穿透深度（約70納米）相符。然而，深層洗滌及後續測試表明，薄改性層中形成的自由基會遷移至本體層，導致深層聚苯乙烯化學結構發生系列變化。因此，儘管離子在聚苯乙烯薄膜中的穿透深度較淺，但整個薄膜的改性深度遠超離子投射範圍。這表明離子束處理僅能條件性地視為表面改性方法，必須考慮自由基反應及其向聚合物深層遷移的可能性。

摘要

原文標題：Quantum decoherence in the Caldeira-Leggett model by the real-time path integral on a computer
中文標題：計算機實時路徑積分下的Caldeira-Leggett模型量子退相干
發布日期：2025-03-26 16:29:38+00:00
作者：Jun Nishimura, Hiromasa Watanabe
分類：hep-lat, cond-mat.stat-mech, hep-th, nucl-th, quant-ph
原文鏈接：http://arxiv.org/abs/2503.20699v1

中文摘要：摘要：我們提出了一種基於實時路徑積分形式的第一性原理計算方法，用於研究開放系統，該方法在計算機上同時處理環境和我們感興趣的系統。通過採用過去十年發展起來的Lefschetz thimble方法，可以普遍克服蒙特卡洛方法應用中的符號問題。本文重點研究Caldeira-Leggett模型——該模型尤其以描述量子退相干現象而聞名。在此模型中，由於典型初始條件下路徑積分呈現高斯特性，計算過程得到極大簡化。通過求解具有龐大但稀疏係數矩陣的線性方程，可確定唯一且複雜的相關鞍點，並能解析完成Lefschetz thimble上的積分。由此，我們在無需假設或近似的情況下，獲得了長時間演化後對環境大量諧振子進行跡運算得到的約化密度矩陣。特別地，我們在特定參數範圍內驗證了退相干時間與耦合常數及溫度的關係——這一關係此前已通過主方程預測得出。

摘要

原文標題：Orbital optimization of large active spaces via AI-accelerators
中文標題：基於AI加速器的大活性空間軌道優化
發布日期：2025-03-26 16:29:44+00:00
作者：Örs Legeza, Andor Menczer, Ádám Ganyecz, Miklós Antal Werner, Kornél Kapás, Jeff Hammond, Sotiris S. Xantheas, Martin Ganahl, Frank Neese
分類：physics.chem-ph, cond-mat.str-el
原文鏈接：http://arxiv.org/abs/2503.20700v1

中文摘要：我們提出了一種高效的軌道優化方法，該方法將高度GPU加速的自旋適應密度矩陣重整化群（DMRG）與ORCA程序包中實現的量子化學完全活性空間自洽場（CAS-SCF）方法相結合。利用最新一代Nvidia GPU硬件的計算能力，我們在包含數千個軌道中數百個電子活性空間尺寸的分子體系中，實現了前所未有的CAS尺寸（82個電子在82個軌道CAS(82,82)）的CAS-SCF軌道優化。針對NVIDIA DGX-A100和DGX-H100硬件，我們對多環芳烴和不同尺寸鐵硫複合物構成的基準體系進行了詳細的DMRG-SCF方法縮放和誤差分析。我們的工作首次證明，在大鍵維度下進行高精度DMRG計算對於獲得可靠收斂的CAS-SCF 能量至關重要。對於更具挑戰性的鐵硫基準體系，我們還發現收斂CAS-SCF計算的優化軌道對DMRG 參數的敏感性高於多環芳烴體系。能夠在數天內獲得如此大尺寸活性空間的收斂CAS-SCF 能量和軌道，降低了將適當軌道納入CAS或選擇正確最小CAS的挑戰，可能為處理強關聯分子體系開闢全新途徑。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數極大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：我們研究一維高斯位置混合模型的非參數極大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定n個數據點時該估計量總是返回最多含n個分量的混合模型，而近期(Wu-Polyanskiy, 2020)對亞高斯數據給出了精確的$O(\log n)$界。本文重點研究$\widehat{\pi}$的計算特性：我們提出一種算法，當$\varepsilon>0$足夠小時，可在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算出Wasserstein距離意義下的$\varepsilon$近似解，其中$K$與數據相關但與$\varepsilon$無關，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子數。我們還可在有限時間內確定性計算出$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有密度函數（相對於Lebesgue測度）的概率分布獨立採樣時，這些保證幾乎必然成立。我們還證明：當$k\leq \sqrt{n}/3$時，限定為k原子型的$\widehat\pi$條件分布在相應$2k-1$維參數空間上具有密度函數，且EM算法幾乎必然具有局部線性收斂性。關鍵工具之一是對非退化曲線的經典傅里葉分析估計。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子間勢的聚合物電解質膜質子傳輸大規模長時原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢能（MLIPs）作為一種能夠實現大規模、長時間原子尺度模擬的方法，同時保持與基於密度泛函理論（DFT）和從頭算波函數理論的電子結構計算相當的精度，引起了廣泛關注。然而，基於MLIP的分子動力學（MD）模擬面臨的一個挑戰是，與傳統經典勢能相比，其穩定性較低。分析高度異質體系或非晶材料通常需要大規模和長時間的模擬，因此需要開發能夠進行穩定MD模擬的魯棒MLIPs。在本研究中，我們利用神經網絡勢能（NNP）生成器，構建了一個NNP模型，能夠在廣泛水合水平範圍內對全氟離子交換膜（Nafion）進行大規模、長時間的MD模擬。通過主動學習循環迭代擴展數據集，我們成功構建了一個魯棒的深度勢能（DP）模型。具體而言，通過將非平衡 DPMD模擬採樣的非平衡結構與結合最小原子間距離的三維結構特徵空間中的結構篩選相結合，可以顯著增強DP模型的魯棒性，從而實現對約10,000至20,000個原子的大型Nafion體系進行長達31 ns的穩定MD模擬。採用所開發的DP模型進行的MD模擬，與之前較小體系的從頭算MD模擬相比，在廣泛水合水平範圍內獲得的氫原子自擴散係數更接近實驗值。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：一個開放、快速、可靠且高效的每日任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過將地址複製到多個位置來實現（例如）降低延遲和增強韌性。由於任播在現代互聯網中的關鍵作用，先前研究已引入工具來執行任播普查。首個工具iGreedy利用地理分散位置的延遲測量來映射任播部署；第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——可在3小時內完成全網普查，但其準確性和精確性存在缺陷。相反，iGreedy精度極高但速度較慢，且探測成本更高。本文針對這兩個系統的不足，提出了MAnycast Reloaded（MAnycastR）。以MAnycast2為基礎，我們徹底重構了其測量流水線，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持以及類似iGreedy的延遲測量功能。我們在含32個全球分布式節點的任播測試平台上驗證MAnycastR，與外部任播生產部署進行對比，通過RIPE Atlas進行廣泛延遲測量，並對檢測到的60%以上任播前綴進行運營商數據交叉驗證。結果表明MAnycastR實現了高準確性與精確度。我們將持續提供每日MAnycastR普查數據，並以寬鬆開源協議發布工具源代碼。

摘要

原文標題：Flow of a two-dimensional liquid foam: Impact of surfactant type and boundary conditions
中文標題：二維液體泡沫流動：表面活性劑類型與邊界條件的影響
發布日期：2025-03-26 16:44:40+00:00
作者：Farshad Nazari, Andrei Potanin, Hadi Mohammadigoushki
分類：cond-mat.soft, physics.flu-dyn
原文鏈接：http://arxiv.org/abs/2503.20710v1

中文摘要：摘要：本研究通過實驗探究了二維單分散水性泡沫的流變與流動行為。使用自製具有光滑/粗糙壁面的流變光學裝置，在平行板間對泡沫施加剪切。實驗採用兩種商用洗滌劑（Foam1和Foam2）製備泡沫，保持氣泡尺寸和液相分數相近。線性粘彈性結果表明：無論邊界條件如何，Foam1始終表現出比Foam2更高的彈性模量和損耗模量，且粗糙壁面會進一步增強兩種泡沫的模量。此外，Foam1的粘彈性鬆弛頻率較低，表明其界面流動性較弱。在非線性區域觀察到顯著差異：光滑邊界條件下，Foam2呈現屈服應力行為而Foam1沒有，儘管後者具有更高的粘性應力。Foam1的粘性應力與毛細管數呈比例關係，而Foam2的標度關係則因光滑/粗糙壁面邊界條件呈現不同特徵。這些流變行為差異源於表面活性劑化學性質的不同所導致的界面流動性差異，其中Foam1的界面流動性低於Foam2。

摘要

原文標題：Search for events with one displaced vertex from long-lived neutral particles decaying into hadronic jets in the ATLAS muon spectrometer in $pp$ collisions at $\sqrt{s}=13$ TeV
中文標題：在$\sqrt{s}=13$ TeV的$pp$對撞中ATLASμ子譜儀內長壽命中性粒子衰變為強子噴注產生單位移頂點的事例搜尋
發布日期：2025-03-26 11:21:36+00:00
作者：ATLAS Collaboration
分類：hep-ex
原文鏈接：http://arxiv.org/abs/2503.20445v1

中文摘要：摘要：本文報道了利用ATLAS探測器在大型強子對撞機上收集的數據（2015-2018年記錄的140 fb$^{-1}$、$\sqrt{s}=13$ TeV質子-質子對撞數據）對長壽命中性粒子衰變為強子噴注產生單位移頂點事件的搜尋。該研究採用頂點重建技術，針對μ子譜儀中距主相互作用頂點3-14米處衰變的長壽命粒子。觀測事件數與預期本底相符，並確定了若干基準信號模型的限制。研究考慮了標量門戶模型和希格斯玻色子門戶重子生成模型，同時採用專用分析道針對Z玻色子伴隨的長壽命粒子產生過程（包括類軸子粒子和暗光子模型）。對於希格斯玻色子模型，在95%置信水平下排除了長壽命粒子固有衰變長度5厘米至40米範圍內分支比高於1%的情況。對於所研究的避光類軸子粒子模型，本次搜尋對固有衰變長度大於$\mathcal{O}(10)$厘米的情況給出了迄今最強的限制。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：基於屬性圖的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：給定圖$G$和種子節點$v_s$，局部圖聚類（LGC）的目標是在與$C_s$大小近似線性時間內識別圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖的應用場景。然而現有方案大多僅依賴圖中節點的拓撲連接性，容易受到現實圖譜中普遍存在的缺失鏈接或噪聲鏈接的影響。為解決該問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC建模為雙向擴散分布（BDD）估計問題，該模型專門用於捕捉帶屬性節點的多跳關聯性。進一步提出LACA方法——一種高效且具備嚴格理論保證的LGC方案：其核心包括（i）基於理論基礎的快速節點屬性預處理技術；（ii）具備加速收斂特性的自適應圖向量擴散算法；（iii）BDD近似計算的三步優化框架。在8個真實數據集上與17種基線方法的對比實驗表明，LACA在真實局部簇標準下的結果質量顯著優於所有對比方法，同時速度可提升數個數量級。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重構動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會新陳代謝系統。供應鏈網絡絕非靜態存在，而是通過企業的進出與供應關係的重組不斷變化。本文利用獨特數據集研究了一個國家供應鏈網絡中企業及其供應商-客戶關係的時間演化。基於匈牙利2014至2022年按月申報的增值稅數據，我們重建了包含711,248家企業和38,644,400條連接的完整經濟網絡，以企業級分辨率覆蓋了整個經濟體的幾乎所有重構事件。研究發現：每年約25%的企業退出供應鏈網絡，同時28%的新企業加入；平均55%的現存供應鏈接會在次年消失；供應鏈接的半衰期為13個月。新鏈接以超偏好依附方式連接企業，概率滿足$p(i)\propto k_i^{1.08}$（$k_i$表示企業$i$的供應連接數）。我們校準了一個能復現匈牙利主導供應鏈網絡典型特徵的簡單統計網絡生成模型，該模型不僅再現了入度/出度分布、同配性和聚類結構等局部網絡特徵，還捕捉了真實的系統性風險特徵。最後討論了當前模型如何通過經濟重連動態來量化系統韌性並評估衝擊傳導。

摘要

原文標題：The Scalar Size of the Pion from Lattice QCD
中文標題：格點QCD中π介子的標量大小
發布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分類：hep-lat, hep-ph
原文鏈接：http://arxiv.org/abs/2503.20687v1

中文摘要：我們提出了一種系統誤差完全受控的格點QCD計算，用於確定π介子標量形狀因子及相關半徑。計算結果基於17個規範場組態的大規模集合，採用$N_f=2+1$味的Wilson-Clover改進海夸克。這些組態覆蓋了從$a=0.049\mathrm{fm}$到$a=0.086\mathrm{fm}$四種格距，$130-350\mathrm{MeV}$的π介子質量範圍以及多種物理體積。通過精確計算著名的夸克斷開貢獻，我們在接近物理夸克質量的大體積精細組態上實現了形狀因子前所未有的動量分辨率。採用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$範圍內多種源匯間距，可靠地提取了零動量轉移與非零動量轉移下的基態矩陣元。這使得我們首次能夠通過所得形狀因子$Q^2$依賴性的$z$展開參數化（而非小動量轉移下的簡單線性近似）獲得標量半徑。使用三味NLO手征微擾理論對半徑進行物理外推，通過三個低能常數（包括首次格點確定的$L_4^r$）參數化夸克質量依賴性。基於赤池信息準則的模型平均方法，系統評估了基態提取、形狀因子參數化以及物理外推對最終結果的系統不確定性。

摘要

原文標題：Ion beam treatment of thick polystyrene films
中文標題：厚聚苯乙烯薄膜的離子束處理
發布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分類：physics.chem-ph
原文鏈接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋塗厚度為78納米至1.3微米的不同厚度聚苯乙烯薄膜，並用能量為20 keV的氮離子進行處理。橢圓偏振測量和傅里葉變換紅外光譜顯示，表面層的改性對應於離子在聚合物中的穿透深度（約70納米）。然而，對深層進行清洗和後續測量表明，在薄改性層中形成的自由基會遷移到體層中，並引起深層聚苯乙烯化學結構的多種變化。因此，儘管離子在聚苯乙烯薄膜中的穿透深度較小，但整個薄膜的改性深度遠大於離子的投影射程。因此，離子束處理聚合物僅在條件上是一種表面改性方法。必須考慮自由基反應及其向聚合物深層遷移的可能性。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數極大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：我們研究一維高斯位置混合的非參數極大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知：給定n個數據點時，該估計量始終返回最多含n個混合模型；近期(Wu-Polyanskiy, 2020)進一步對次高斯數據給出了精確的$O(\log n)$界。本文重點研究$\widehat{\pi}$的計算特性：我們提出一種算法，當$\varepsilon>0$足夠小時，可在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算出Wasserstein距離意義上的$\varepsilon$近似解，其中$K$與數據相關但與$\varepsilon$無關，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子數量。我們還實現了支撐集基數$|supp(\widehat\pi)|$的有限時間可驗證計算。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$來自具有Lebesgue測度密度的獨立分布時，這些保證幾乎必然成立。此外，我們證明當$k\leq \sqrt{n}/3$時，限定為k原子結構的$\widehat\pi$條件分布在相應$2k-1$維參數空間上具有密度，且EM算法幾乎必然局部線性收斂。關鍵工具之一是非退化曲線的經典傅里葉分析估計。

摘要

原文標題：Orbital optimization of large active spaces via AI-accelerators
中文標題：基於AI加速器的大活性空間軌道優化方法
發布日期：2025-03-26 16:29:44+00:00
作者：Örs Legeza, Andor Menczer, Ádám Ganyecz, Miklós Antal Werner, Kornél Kapás, Jeff Hammond, Sotiris S. Xantheas, Martin Ganahl, Frank Neese
分類：physics.chem-ph, cond-mat.str-el
原文鏈接：http://arxiv.org/abs/2503.20700v1

中文摘要：我們提出了一種高效的軌道優化方法，該方法將高度GPU加速的自旋適應密度矩陣重整化群（DMRG）與ORCA程序包中實現的量子化學完全活性空間自洽場（CAS-SCF）方法相結合。利用最新一代Nvidia GPU硬件的計算能力，我們在包含數千個軌道中數百個電子活性空間尺寸的分子體系中，實現了前所未有的CAS尺寸軌道優化——高達82個電子和82個軌道CAS(82,82)。針對NVIDIA DGX-A100和DGX-H100硬件，我們對多環芳烴和不同尺寸鐵硫配合物基準體系進行了詳細的DMRG-SCF方法縮放和誤差分析。研究首次證明：在大鍵維度下進行高精度 DMRG計算對獲得可靠收斂的CAS-SCF能量至關重要。對於更具挑戰性的鐵硫基準體系，我們還發現收斂CAS-SCF計算的優化軌道對DMRG參數的敏感性高於多環芳烴體系。能在數日內獲得如此大尺寸活性空間的收斂CAS-SCF能量和軌道，不僅降低了將適當軌道納入CAS或選擇正確最小CAS的挑戰，還可能為處理強關聯分子體系開闢全新途徑。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子勢的聚合物電解質膜質子傳輸大規模長時原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢（MLIPs）作為一種能夠實現大規模、長時間原子模擬並保持與基於密度泛函理論（DFT）和從頭算波函數理論的電子結構計算相當精度的方法，受到了廣泛關注。然而，基於MLIP的分子動力學（MD）模擬面臨的關鍵挑戰是其穩定性低於傳統經典勢函數。分析高度異質體系或非晶材料通常需要大規模長時間模擬，這要求開發能夠實現穩定MD模擬的魯棒性MLIP。本研究利用我們的神經網絡勢（NNP）生成器，構建了一個能在廣泛水合水平範圍內對全氟離聚物膜（Nafion）進行大規模長時間MD模擬的NNP模型。通過主動學習循環迭代擴展數據集，我們成功建立了魯棒的深度勢（DP）模型。具體而言，通過將非平衡DPMD模擬採樣的非平衡結構與結合最小原子間距的三維結構特徵空間篩選相結合，可顯著提升DP模型的魯棒性，從而實現對約10,000至20,000原子的大型Nafion體系進行長達31納秒的穩定MD模擬。採用所開發DP模型的MD模擬獲得的氫原子自擴散係數，在廣泛水合水平範圍內比先前小體系從頭算MD模擬結果更接近實驗值。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：多播重裝上陣：面向開放、快速、可靠且高效日常多播普查的工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過將地址複製到多個位置來實現降低延遲和增強韌性等目標。鑑於任播在現代互聯網中的關鍵作用，先前研究已開發了執行任播普查的工具。首個工具iGreedy利用地理分散位置的延遲測量來繪製任播部署圖；第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——可在3小時內完成全網普查，但存在準確性和精確性問題。反之，iGreedy精度極高但速度較慢，且探測成本更高。本文針對這兩個系統的缺陷提出了MAnycast Reloaded（MAnycastR）。以MAnycast2為基礎，我們徹底重構了其測量管道，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持以及類似iGreedy的延遲測量功能。我們在含32個全球分布式節點的任播測試平台上驗證MAnycastR，對比實際任播生產部署，通過RIPE Atlas進行廣泛延遲測量，並將檢測到的任播前綴中超過60%與運營商真實數據進行交叉驗證。結果表明MAnycastR實現了高準確性與精確度。我們以寬鬆的開源許可向社區提供每日持續的MAnycastR普查數據，並公開該工具的源代碼。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：基於屬性圖的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：給定圖$G$和種子節點$v_s$，局部圖聚類（LGC）的目標是在與$C_s$大小大致成線性關係的時間內，識別出圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖的應用場景。然而，現有解決方案大多僅依賴圖中節點的拓撲連接關係，容易受到現實圖數據中普遍存在的缺失邊或噪聲邊的影響。為解決該問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC問題建模為雙向擴散分布（BDD）估計問題，該模型專門用於捕捉帶屬性節點的多跳關聯性。進一步提出LACA方法——一種高效且具備嚴格理論保證的LGC解決方案：其核心包括（i）基於理論基礎的快速節點屬性預處理技術，（ii）具備加速收斂特性的自適應向量擴散算法，以及（iii）BDD近似計算的三步優化方案。在8個真實數據集上與17種基線方法的對比實驗表明，LACA在真實局部簇的評估指標上全面優於所有對比方法，同時實現數量級的速度提升。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重連動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會代謝系統。SCN絕非靜態存在，而是通過企業的進出與供應關係的重組持續演變。本研究利用獨特數據集追蹤了一個國家供應鏈網絡中企業及其供需關係的時序演化。基於匈牙利2014至2022年按月申報的增值稅數據，我們重建了包含711,248家企業和38,644,400條連接的整體經濟網絡，實現了企業級分辨率的經濟結構全息記錄。研究發現：每年約25%的企業退出SCN，同時28%的新企業加入；平均55%的年度供應關係會在次年消失；供應關係的半衰期為13個月。新連接以超偏好依附概率$p(i)\propto k_i^{1.08}$（$k_i$表示企業i的連接數）形成。我們校準的簡易統計網絡生成模型成功復現了匈牙利主導SCN的典型特徵，不僅能重現入/出度分布、同配性和聚類結構等局部特徵，還能捕捉真實的系統性風險輪廓。該模型揭示了經濟網絡重連動力學對量化系統韌性和估計衝擊傳導的關鍵作用。

摘要

原文標題：The Scalar Size of the Pion from Lattice QCD
中文標題：格點QCD中π介子的標量大小
發布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分類：hep-lat, hep-ph
原文鏈接：http://arxiv.org/abs/2503.20687v1

中文摘要：我們提出了一種系統誤差完全受控的格點QCD計算，用於確定π介子標量形狀因子及相關半徑。計算結果基於17個規範系綜的大規模數據集，這些系綜採用$N_f=2+1$威爾遜Clover改進海夸克配置，涵蓋$a=0.049\mathrm{fm}$至$a=0.086\mathrm{fm}$四種晶格間距、$130-350\mathrm{MeV}$的π介子質量範圍及多種物理體積。通過對棘手夸克斷開貢獻的精確測定，我們在接近物理夸克質量的大尺寸精細系綜上實現了形狀因子前所未有的動量分辨率。採用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$的大範圍源匯間距，可靠地提取了零動量轉移與非零動量轉移下的基態矩陣元。這使得我們首次能通過所得形狀因子$Q^2$依賴性的$z$展開參數化（而非小動量轉移下的簡單線性近似）獲取標量半徑。物理外推採用三味NLO手征微擾理論，以三個低能常數（包括$L_4^r$的首個格點測定值）參數化夸克質量依賴性。通過基於赤池信息準則的模型平均，系統評估了基態提取、形狀因子參數化及物理外推對最終結果的系統不確定性。

摘要

原文標題：Ion beam treatment of thick polystyrene films
中文標題：厚聚苯乙烯薄膜的離子束處理
發布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分類：physics.chem-ph
原文鏈接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋塗厚度為78納米至1.3微米的不同厚度聚苯乙烯薄膜，採用能量為20 keV的氮離子束進行處理。橢偏儀測量和傅里葉變換紅外光譜顯示，表面層的改性對應於離子在聚合物中的穿透深度（約70納米）。然而，對深層進行清洗和後續測量表明，在薄改性層中形成的自由基會遷移至本體層，並導致深層聚苯乙烯化學結構發生一系列變化。因此，儘管離子在聚苯乙烯薄膜中的穿透深度較小，但整個薄膜的改性深度遠大於離子的投影射程。由此可見，聚合物離子束處理僅在特定條件下可視為表面改性方法。必須考慮自由基反應及其向聚合物深層遷移的可能性。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數最大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：我們研究一維高斯位置混合模型的非參數最大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定n個數據點時，該估計量總是返回最多含n個分量的混合模型，而近期(Wu-Polyanskiy, 2020)對亞高斯數據給出了嚴格的$O(\log n)$界。本文研究$\widehat{\pi}$的計算特性：我們提出的算法能在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算Wasserstein距離下的$\varepsilon$近似解，其中$K$與$\varepsilon$無關但依賴數據，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子數。我們還可在有限時間內確定性計算$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$來自具有密度（相對於Lebesgue測度）的概率分布時，這些保證幾乎必然成立。我們進一步證明：當$k\leq \sqrt{n}/3$時，限定為k原子結構的$\widehat\pi$條件分布在相關$2k-1$維參數空間上存在密度，且EM算法幾乎必然具有局部線性收斂性。關鍵工具之一是非退化曲線的經典傅里葉分析估計。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子勢的聚合物電解質膜質子傳輸大規模長時原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢（MLIPs）作為一種能夠實現大規模、長時間原子模擬的方法備受關注，同時保持與基於密度泛函理論（DFT）和從頭算波函數理論的電子結構計算相當的精度。然而，基於MLIP的分子動力學（MD）模擬面臨的挑戰是其穩定性低於使用傳統經典勢的模擬。分析高度異質體系或非晶材料通常需要大規模和長時間的模擬，因此需要開發能夠實現穩定MD模擬的魯棒MLIPs。在本研究中，我們利用神經網絡勢（NNP）生成器，構建了一個NNP模型，能夠在廣泛水合水平下對全氟離聚物膜（Nafion）進行大規模、長時間的MD模擬。通過主動學習循環迭代擴展數據集，我們成功建立了魯棒的深度勢（DP）模型。具體而言，通過將非平衡DPMD模擬採樣的非平衡結構與結合最小原子間距離的三維結構特徵空間中的結構篩選相結合，可以顯著增強DP模型的魯棒性，從而實現對約10,000至20,000個原子的大型Nafion體系進行長達31 ns的穩定MD模擬。採用所開發DP模型的MD模擬獲得的氫原子自擴散係數，在廣泛水合水平範圍內與實驗值更為接近，優於先前對小體系進行的從頭算MD模擬結果。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：多播重裝上陣：一個開放、快速、可靠且高效的日常多播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過在多位置複製地址來實現降低延遲和增強韌性等目標。由於任播在現代互聯網中的關鍵作用，先前研究已開發了多種任播普查工具。首款工具iGreedy通過地理分散的延遲測量來繪製任播部署圖；第二款工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——僅需3小時即可完成全網普查，但存在準確性和精確度問題。反之，iGreedy精度極高但速度較慢，且探測成本顯著更高。本文針對這兩個系統的缺陷，提出了升級版MAnycast Reloaded（MAnycastR）。以MAnycast2為基礎，我們徹底重構了其測量流程，新增分布式探測支持、多協議（UDP/TCP/IPv6）兼容性以及類似iGreedy的延遲測量功能。通過在含32個全球分布式節點的任播測試床上驗證，與真實任播生產環境對比，並利用RIPE Atlas進行大規模延遲測量交叉檢驗（其中60%以上檢測到的任播前綴通過運營商真實數據覆核），證明MAnycastR具備高準確性與精確度。我們將持續提供每日任播普查數據，並以寬鬆開源協議發布工具源代碼。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：基於屬性圖的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：給定圖$G$和種子節點$v_s$，局部圖聚類（LGC）的目標是在與$C_s$大小近似線性相關的時間內，識別出圍繞$v_s$的子圖$C_s$（即局部簇）。該方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖的應用場景。然而現有方案大多僅依賴圖中節點的拓撲連接性，容易受到現實圖數據中普遍存在的缺失鏈接或噪聲鏈接的影響。為解決該問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC建模為雙向擴散分布（BDD）的估計問題，該模型專門用於捕捉含屬性圖中節點的多跳關聯性。進一步提出LACA方法——一種高效且具備強局部性的LGC解決方案，在多個真實數據集上展現出卓越性能。其核心組件包括：（i）基於理論基礎的快速節點屬性預處理技術；（ii）具備嚴格理論保證和加速收斂特性的自適應向量擴散算法；（iii）高效的三步式BDD近似方案。通過在8個真實數據集上與17種對比方法的實驗表明，LACA在真實局部簇標準下的結果質量優於所有對比方法，同時速度可提升數個數量級。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重構動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成了任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會新陳代謝系統。供應鏈網絡絕非靜態，而是通過企業的進出和供應關係的重組不斷變化。本文利用獨特數據集研究了一個國家供應鏈網絡中企業及其供應商-買方關係的時間演化。基於匈牙利2014至2022年每月報告的增值稅數據，我們重建了包含711,248家企業和38,644,400條連接的整體經濟網絡，以企業級分辨率覆蓋了幾乎整個經濟體的所有重構事件。研究發現：每年約25%的企業退出供應鏈網絡，同時28%的新企業加入；平均55%的現有供應鏈接會在次年消失；供應鏈接的半衰期為13個月。新鏈接以超偏好依附概率$p(i)\propto k_i^{1.08}$（$k_i$表示企業i的供應連接數）附着於企業。我們校準了一個能復現匈牙利主導供應鏈網絡典型特徵的簡單統計網絡生成模型，該模型不僅復現了入/出度分布、同配性和聚類結構等局部網絡特徵，還捕捉了真實的系統性風險特徵。最後討論了該模型如何通過經濟重連動態來量化系統韌性和估計衝擊傳導。

摘要

原文標題：The Scalar Size of the Pion from Lattice QCD
中文標題：π介子標量尺寸的格點QCD計算
發布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分類：hep-lat, hep-ph
原文鏈接：http://arxiv.org/abs/2503.20687v1

中文摘要：我們採用格點QCD方法計算了π介子標量形狀因子及相關半徑，並實現了系統誤差的完全控制。計算結果基於17組N_f=2+1威爾遜Clover改進海夸克的規範系綜，涵蓋0.049-0.086fm四種晶格間距、130-350MeV的π介子質量範圍及多種物理體積。通過對著名的夸克斷開貢獻的精確測定，我們在接近物理夸克質量的大尺寸精細系綜上實現了形狀因子前所未有的動量分辨率。採用1.0-3.25fm寬範圍的源匯分離距離，可靠地提取了零動量轉移和非零動量轉移下的基態矩陣元。這使得我們首次能通過形狀因子Q^2依賴性的z-展開參數化（而非小動量轉移下的簡單線性近似）獲得標量半徑。使用三味NLO手征微擾理論將夸克質量依賴性參數化為三個低能常數（包含L_4^r的首次格點測定）進行物理外推，並通過基於赤池信息準則的模型平均方法處理基態提取、形狀因子參數化及物理外推相關的系統誤差。

摘要

原文標題：Ion beam treatment of thick polystyrene films
中文標題：厚聚苯乙烯薄膜的離子束處理
發布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分類：physics.chem-ph
原文鏈接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋塗厚度為78納米至1.3微米的聚苯乙烯薄膜，經20 keV氮離子束處理後，橢圓偏振測量和傅里葉變換紅外光譜顯示表面改性層對應於離子在聚合物中的穿透深度（約70納米）。然而，深層洗滌及後續測量表明，薄改性層中形成的自由基會遷移至本體層，導致深層聚苯乙烯化學結構發生一系列變化。因此，儘管離子在聚苯乙烯薄膜中的穿透深度較淺，但整個薄膜的改性深度遠超過離子的投影射程。由此可見，聚合物離子束處理僅在特定條件下屬於表面改性方法，必須考慮自由基反應及其向聚合物深層遷移的可能性。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數最大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：摘要：我們研究一維高斯位置混合的非參數極大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定n個數據點時，該估計量始終返回最多含n個分量的混合模型，而近期(Wu-Polyanskiy, 2020)對亞高斯數據給出了尖銳的$O(\log n)$界。本文研究$\widehat{\pi}$的計算特性：針對足夠小的$\varepsilon>0$，我們提出算法可在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算Wasserstein距離意義上的$\varepsilon$近似解，其中$K$與數據相關但與$\varepsilon$無關，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子數。我們還可在有限時間內確定性計算$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有密度（相對於Lebesgue測度）的概率分布獨立採樣時，這些保證幾乎必然成立。我們還證明：當$k\leq \sqrt{n}/3$時，限定為k原子性的$\widehat\pi$條件分布在相應$2k-1$維參數空間上具有密度，且EM算法幾乎必然局部線性收斂。關鍵工具之一是非退化曲線的經典傅里葉分析估計。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子勢的大規模長時質子交換膜質子傳輸原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢（MLIPs）作為一種能夠實現大規模、長時間原子模擬的方法備受關注，同時保持與基於密度泛函理論（DFT）和從頭算波函數理論的電子結構計算相當的精度。然而，基於MLIP的分子動力學（MD）模擬面臨的挑戰是其穩定性低於使用傳統經典勢的模擬。分析高度異質體系或非晶材料通常需要大規模和長時間的模擬，因此需要開發能夠進行穩定MD模擬的魯棒MLIPs。在本研究中，我們利用神經網絡勢（NNP）生成器，構建了一個NNP模型，能夠在廣泛水合水平下對全氟離聚物膜（Nafion）進行大規模、長時間的MD模擬。通過主動學習循環迭代擴展數據集，我們成功構建了魯棒的深度勢（DP）模型。具體而言，通過結合非平衡DPMD模擬採樣的非平衡結構，以及在包含最小原子間距離的3D結構特徵空間中進行結構篩選，可以顯著增強DP模型的魯棒性，從而實現對約10,000至20,000個原子的大型Nafion系統進行長達31 ns的穩定MD模擬。採用所開發DP模型的MD模擬得到的氫原子自擴散係數，在廣泛水合水平範圍內與實驗值更為接近，優於先前對小體系進行的從頭算MD模擬結果。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：開放、快速、可靠且高效的日常任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過將地址複製到多個位置來實現降低延遲和增強韌性等目標。由於任播在現代互聯網中的關鍵作用，先前研究已開發了執行任播普查的工具。首個工具iGreedy利用地理分散位置的延遲測量來繪製任播部署圖；第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——僅需3小時即可完成全網普查，但存在準確性和精確性問題。相反，iGreedy準確性極高但速度較慢，且探測成本更高。本文針對這兩個系統的缺陷提出了MAnycast Reloaded（MAnycastR）。以MAnycast2為基礎，我們徹底重新設計了其測量流程，新增了分布式探測支持、額外協議（UDP、TCP和IPv6）支持以及類似iGreedy的延遲測量功能。我們在包含32個全球分布式節點的任播測試平台上驗證MAnycastR，與外部任播生產部署進行對比，並通過RIPE Atlas進行廣泛延遲測量，同時對檢測到的60%以上任播前綴進行運營商實地驗證交叉檢查。結果表明MAnycastR實現了高準確性和精確度。我們將持續提供每日MAnycastR普查數據，並以寬鬆的開源許可協議發布該工具的源代碼。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：基於屬性圖的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：給定圖$G$和種子節點$v_s$，局部圖聚類（LGC）的目標是在與$C_s$大小大致成線性關係的時間內，識別出圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖的應用場景。然而，現有解決方案大多僅依賴圖中節點的拓撲連接性，容易受到現實圖數據中普遍存在的缺失或噪聲鏈接的影響。為解決該問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC建模為雙向擴散分布（BDD）的估計問題，該模型專門用於捕捉帶屬性節點的多跳關聯性。進一步提出LACA方法——一種高效且具備強局部性的LGC解決方案，在多個真實數據集上表現出卓越性能。其核心組件包括：(i) 基於理論基礎的快速節點屬性預處理技術，(ii) 具有嚴格理論保證和加速收斂特性的自適應向量擴散算法，(iii) 高效的三步式BDD近似方案。通過在8個真實數據集上與17種對比方法的實驗表明，LACA在真實局部簇標準下的結果質量優於所有對比方法，同時速度可提升數個數量級。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重構動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會新陳代謝系統。SCN絕非靜態存在，而是通過企業的進出與供應關係的重組持續演變。本研究利用獨特數據集追蹤了一個國家SCN中企業及其供應商-客戶關係的時間演化。基於匈牙利2014至2022年每月報告的增值稅數據，我們重建了包含711,248家企業和38,644,400條連接的整體經濟網絡，以企業級分辨率覆蓋了近乎所有經濟重構事件。研究發現：每年約25%的企業退出SCN，同時28%的新企業加入；平均55%的現存供應鏈接會在次年消失；供應鏈接的半衰期為13個月。新鏈接以超偏好依附方式連接企業，概率滿足$p(i)\propto k_i^{1.08}$（$k_i$表示企業i的供應連接數）。我們校準了一個能復現匈牙利主導SCN典型特徵的統計網絡生成模型，該模型不僅再現了入/出度分布、同配性和聚類結構等局部網絡特徵，還捕捉了真實的系統性風險輪廓。最後探討了經濟重連動態對量化系統韌性和估計衝擊傳導的關鍵作用。

摘要

原文標題：The Scalar Size of the Pion from Lattice QCD
中文標題：π介子標量尺寸的格點QCD計算
發布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分類：hep-lat, hep-ph
原文鏈接：http://arxiv.org/abs/2503.20687v1

中文摘要：我們提出了一種系統誤差完全受控的格點QCD計算，用於確定π介子標量形狀因子及相關半徑。計算結果基於17個規範系綜的大規模數據集，這些系綜採用$N_f=2+1$威爾遜Clover改進的海夸克。這些系綜覆蓋了從$a=0.049\mathrm{fm}$到$a=0.086\mathrm{fm}$四種格點間距，π介子質量範圍為$130-350\mathrm{MeV}$以及多種物理體積。通過精確計算著名的夸克斷開貢獻，我們首次在接近物理夸克質量的大尺寸精細系綜上實現了形狀因子前所未有的動量分辨率。採用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$的大範圍源匯間距，可靠地提取了零動量轉移和非零動量轉移下的相關基態矩陣元。這使得我們首次能夠通過所得形狀因子$Q^2$依賴性的$z$展開參數化（而非小動量轉移下的簡單線性近似）來獲取標量半徑。半徑的物理外推採用三味NLO手征微擾理論，通過三個低能常數（包括$L_4^r$的首次格點測定）來參數化夸克質量依賴性。基於赤池信息準則的模型平均方法，我們對基態提取、形狀因子參數化以及物理外推等環節產生的系統誤差進行了量化處理。

摘要

原文標題：Ion beam treatment of thick polystyrene films
中文標題：厚聚苯乙烯薄膜的離子束處理
發布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分類：physics.chem-ph
原文鏈接：http://arxiv.org/abs/2503.20359v1

中文摘要：在硅片上旋塗的不同厚度（78納米至1.3微米）聚苯乙烯薄膜經20 keV氮離子束處理後，橢偏儀測量和傅里葉變換紅外光譜顯示表面改性層深度與離子在聚合物中的穿透深度（約70納米）相符。然而，深層洗滌及後續測試表明，薄改性層中形成的自由基會遷移至本體層，導致深層聚苯乙烯化學結構發生系列變化。因此，儘管離子在聚苯乙烯膜中的穿透深度較淺，整個薄膜的改性深度仍遠超過離子投影射程。這表明離子束處理僅能有條件地視為表面改性方法，必須考慮自由基反應及其向聚合物深層遷移的可能性。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數極大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：我們研究一維高斯位置混合模型的非參數最大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定n個數據點時該估計量總是返回最多含n個分量的混合模型，而近期(Wu-Polyanskiy, 2020)對亞高斯數據給出了嚴格的$O(\log n)$界。本文重點研究$\widehat{\pi}$的計算特性：我們提出的算法能在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算出Wasserstein距離意義上的$\varepsilon$近似解，其中$K$與數據相關但與$\varepsilon$無關，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子數量。該算法還能在有限時間內確定性地計算$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$中的點獨立採樣自具有Lebesgue測度密度的概率分布時，這些保證幾乎必然成立。我們還證明：當$k\leq \sqrt{n}/3$時，限定為k原子型的$\widehat\pi$條件分布在相應$2k-1$維參數空間上存在密度函數，且EM算法幾乎必然具有局部線性收斂性。關鍵工具之一是對非退化曲線的經典傅里葉分析估計。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子勢的大規模長時質子傳輸聚合物電解質膜原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢能（MLIPs）作為一種能夠實現大規模、長時間原子模擬並保持與基於密度泛函理論（DFT）和從頭算波函數理論的電子結構計算相當精度的方法，受到廣泛關注。然而，基於MLIP的分子動力學（MD）模擬面臨的關鍵挑戰是其穩定性低於傳統經典勢能方法。分析高度異質體系或非晶材料通常需要大規模長時間模擬，因此亟需開發能夠實現穩定MD模擬的魯棒性MLIP。本研究利用自主開發的神經網絡勢能（NNP）生成器，構建了可在廣泛水合水平下對全氟離聚物膜（Nafion）進行大規模長時間MD模擬的NNP模型。通過主動學習循環迭代擴展數據集，我們成功建立了魯棒的深度勢能（DP）模型。具體而言，通過結合非平衡DPMD模擬採樣的非平衡結構，以及在包含最小原子間距的三維結構特徵空間中進行結構篩選，可顯著提升DP模型的魯棒性。該模型能對約10,000至20,000個原子的大型Nafion體系進行長達31納秒的穩定MD模擬。採用所開發DP模型的MD模擬結果表明，與先前小體系從頭算MD模擬相比，氫原子自擴散係數在更廣泛水合水平範圍內與實驗值更為吻合。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：多播重裝上陣：開放、快速、可靠且高效的日常任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過在多位置複製地址來實現降低延遲和增強韌性等目標。鑑於任播在現代互聯網中的關鍵作用，先前研究已開發了執行任播普查的工具。首個工具iGreedy利用地理分散位置的延遲測量來繪製任播部署圖；第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——可在3小時內完成全網普查，但存在準確性和精確度問題。反之，iGreedy精度極高但速度較慢，且探測成本顯著更高。本文針對這兩個系統的缺陷，提出了升級版MAnycast Reloaded（MAnycastR）。以MAnycast2為基礎，我們徹底重構了其測量流水線，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持以及類似iGreedy的延遲測量功能。我們在含32個全球分布式節點的任播測試平台上驗證MAnycastR，與外部任播生產部署進行對比，通過RIPE Atlas進行廣泛延遲測量，並對檢測到的60%以上任播前綴進行運營商數據交叉核驗。結果表明MAnycastR實現了高準確性與精確度。我們將持續提供每日MAnycastR普查數據，並以寬鬆開源協議發布工具源代碼。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：基於屬性圖的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：給定圖$G$和種子節點$v_s$，局部圖聚類(LGC)的目標是在與$C_s$大小近似線性相關的時間內，識別出圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖的應用場景。然而，現有解決方案大多僅依賴圖中節點的拓撲連接性，容易受到現實圖數據中普遍存在的缺失或噪聲鏈接的影響。為解決這一問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC建模為雙向擴散分布(BDD)的估計問題，該模型專門用於捕捉含屬性圖中節點的多跳關聯性。進一步提出LACA方法——一種高效且具備強局部性的LGC解決方案，在多個真實數據集上表現出卓越性能。其核心組件包括：(i) 基於理論基礎的快速節點屬性預處理技術；(ii) 具有嚴格理論保證和加速收斂特性的自適應向量擴散算法；(iii) 有效的BDD近似三步方案。通過在8個真實數據集上與17種對比方法的實驗表明，LACA在真實局部簇標準下的結果質量優於所有對比方法，同時速度可提升數個數量級。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重構動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會新陳代謝系統。SCN絕非靜態存在，而是通過企業的進出與供應關係的重組持續演變。本研究利用獨特數據集追蹤了一個國家SCN中企業及其供應商-客戶關係的時間演化。基於匈牙利2014至2022年按月申報的增值稅數據，我們重建了包含711,248家企業和38,644,400條連接的整體經濟網絡，以企業級分辨率覆蓋了近乎所有經濟重構事件。研究發現：每年約25%的企業退出SCN，同時28%的新企業加入；平均55%的現存供應鏈接會在次年消失；供應鏈接的半衰期為13個月。新鏈接以超偏好依附方式連接企業，概率滿足$p(i)\propto k_i^{1.08}$（$k_i$為企業i的供應連接數）。我們校準的簡易統計網絡生成模型成功復現了匈牙利主導SCN的典型特徵，不僅能重現入/出度分布、同配性和聚類結構等局部網絡特徵，還能捕捉真實的系統性風險輪廓。最後探討了該模型如何通過經濟重連動態來量化系統韌性及評估衝擊傳導。

摘要

原文標題：The Scalar Size of the Pion from Lattice QCD
中文標題：格點QCD中π介子標量大小的計算
發布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分類：hep-lat, hep-ph
原文鏈接：http://arxiv.org/abs/2503.20687v1

中文摘要：我們提出了一種系統誤差完全受控的格點QCD計算，用於確定π介子標量形狀因子及相關半徑。計算結果基於17個規範系綜的大規模數據集，這些系綜採用$N_f=2+1$威爾遜Clover改進海夸克配置，涵蓋$0.049\mathrm{fm}$至$0.086\mathrm{fm}$四種晶格間距、$130-350\mathrm{MeV}$的π介子質量範圍及多種物理體積。通過精確計算著名的夸克斷開貢獻，首次在接近物理夸克質量的大尺寸精細系綜上實現了形狀因子的超高動量分辨率。採用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$的寬範圍源匯間距，可靠地提取了零動量轉移與非零動量轉移下的基態矩陣元。這使得我們首次能通過形狀因子$Q^2$依賴性的$z$展開參數化（而非小動量轉移下的簡單線性近似）獲得標量半徑。物理外推採用三味NLO手征微擾理論，以三個低能常數（包括$L_4^r$的首個格點測定值）參數化夸克質量依賴性，並通過基於赤池信息準則的模型平均方法量化基態提取、形狀因子參數化及物理外推等系統不確定性。

摘要

原文標題：Ion beam treatment of thick polystyrene films
中文標題：厚聚苯乙烯薄膜的離子束處理
發布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分類：physics.chem-ph
原文鏈接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋塗厚度從78納米至1.3微米不等的聚苯乙烯薄膜，採用能量為20 keV的氮離子束進行處理。橢偏儀測量和傅里葉變換紅外光譜顯示，表面改性層的深度與離子在聚合物中的穿透深度（約70納米）相符。然而，對深層進行清洗及後續測量表明，薄改性層中形成的自由基會遷移至體層，導致深層聚苯乙烯的化學結構發生一系列變化。因此，儘管離子在聚苯乙烯薄膜中的穿透深度較淺，但整個薄膜的改性深度遠超過離子的投影射程。由此可見，聚合物離子束處理僅在特定條件下屬於表面改性方法，必須考慮自由基反應及其向聚合物深層遷移的可能性。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數極大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：我們研究一維高斯位置混合的非參數極大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定n個數據點時，該估計量始終返回最多含n個分量的混合分布；近期(Wu-Polyanskiy, 2020)更對次高斯數據給出了尖銳的$O(\log n)$界。本文研究$\widehat{\pi}$的計算特性：提出一種算法，當$\varepsilon>0$足夠小時，可在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算得到$\widehat\pi$的Wasserstein距離$\varepsilon$-近似解。其中$K$依賴數據但獨立於$\varepsilon$，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子數。我們還可在有限時間內確定性計算$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有密度（相對於Lebesgue測度）的概率分布獨立採樣生成時，這些保證幾乎必然成立。我們還證明：當$k\leq \sqrt{n}/3$時，限定為k原子分布的$\widehat\pi$條件分布在相應$2k-1$維參數空間上存在密度，且EM算法幾乎必然具有局部線性收斂性。關鍵工具之一是對非退化曲線的經典傅里葉分析估計。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子勢的大規模長時質子交換膜質子傳輸原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢（MLIPs）作為一種能夠實現大規模、長時間原子模擬並保持與基於密度泛函理論（DFT）和從頭算波函數理論的電子結構計算相媲美精度的方法，受到廣泛關注。然而，基於MLIP的分子動力學（MD）模擬面臨的關鍵挑戰是其穩定性低於傳統經典勢函數。分析高度異質體系或非晶材料通常需要大規模長時間模擬，這要求開發能夠實現穩定MD模擬的魯棒性MLIP。本研究利用我們的神經網絡勢（NNP）生成器，構建了一個能在廣泛水合水平範圍內對全氟離聚物膜（Nafion）進行大規模長時間MD模擬的NNP模型。通過主動學習循環迭代擴展數據集，我們成功建立了魯棒的深度勢（DP）模型。具體而言，通過將非平衡DPMD模擬採樣的非平衡結構與融合最小原子間距的三維結構特徵空間篩選相結合，可顯著提升DP模型的魯棒性，從而實現對約10,000至20,000原子的大型Nafion體系進行長達31納秒的穩定MD模擬。採用所開發DP模型的MD模擬獲得的氫原子自擴散係數，在廣泛水合水平範圍內比先前小體系從頭算MD模擬結果更接近實驗值。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：開放、快速、可靠且高效的每日任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過將地址複製到多個位置來實現（例如）降低延遲和增強韌性。由於任播在現代互聯網中的關鍵作用，先前研究已開發了執行任播普查的工具。首個工具iGreedy利用地理分散位置的延遲測量來繪製任播部署圖；第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——可在3小時內完成全網普查，但存在準確性和精確性問題。相反，iGreedy精度極高但速度較慢，且探測成本更高。本文針對這兩個系統的缺陷，提出了MAnycast Reloaded（MAnycastR）。以MAnycast2為基礎，我們徹底重新設計了其測量流程，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持，以及類似iGreedy的延遲測量功能。我們在含32個全球分布式節點的任播測試平台上驗證MAnycastR，與外部任播生產部署對比，並通過RIPE Atlas進行廣泛延遲測量，同時對檢測到的60%以上任播前綴進行運營商實地驗證交叉檢查。結果表明MAnycastR實現了高準確性與精確性。我們將持續提供每日MAnycastR普查數據，並以寬鬆開源協議發布工具源代碼。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：屬性圖上的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：給定圖$G$和種子節點$v_s$，局部圖聚類(LGC)的目標是在與$C_s$大小大致成線性關係的時間內，識別出圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖的應用場景。然而現有方案大多僅依賴圖中節點的拓撲連接性，容易受到現實圖數據中普遍存在的缺失或噪聲鏈接的影響。為解決此問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC建模為雙向擴散分布(BDD)的估計問題，該模型專門用於捕捉帶屬性節點的多跳關聯性。進一步提出LACA方法——一種高效且具備嚴格理論保證的LGC解決方案，在保持強局部性的同時，在多個真實數據集上展現出卓越性能。LACA的核心組件包括：(i) 基於理論基礎的快速節點屬性預處理技術；(ii) 具有嚴格理論保證且加速收斂的自適應向量擴散算法；(iii) 高效的三步式BDD近似方案。通過在8個真實數據集上與17種對比方法的實驗表明，LACA在真實局部簇標準下的結果質量優於所有對比方法，同時速度可提升數個數量級。代碼已開源在https://github.com/HaoranZ99/alac。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重構動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會新陳代謝系統。SCN絕非靜態存在，而是通過企業的進出和供應關係的重組持續演變。本研究利用獨特數據集追蹤了一個國家SCN中企業及其供應商-客戶關係的時間演化。基於匈牙利2014至2022年每月增值稅數據，我們重建了包含711,248家企業和38,644,400條連接的完整經濟網絡，以企業級分辨率捕捉了整個經濟體的幾乎每次重構事件。研究發現：每年約25%的企業退出SCN，同時28%的新企業加入；平均55%的現存供應關係會在次年消失；供應關係的半衰期為13個月。新連接以超偏好依附方式鏈接企業，概率滿足$p(i)\propto k_i^{1.08}$（$k_i$表示企業$i$的連接數）。我們校準的簡單統計網絡生成模型成功復現了匈牙利主導SCN的典型特徵，不僅能重現入/出度分布、同配性和聚類結構等局部特徵，還能捕捉真實的系統性風險輪廓。最後探討了該模型如何通過經濟重連動態來量化系統韌性和估計衝擊傳導。

摘要

原文標題：Ion beam treatment of thick polystyrene films
中文標題：厚聚苯乙烯薄膜的離子束處理
發布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分類：physics.chem-ph
原文鏈接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋塗厚度從78納米至1.3微米不等的聚苯乙烯薄膜，採用能量為20 keV的氮離子束進行處理。橢偏儀測量和傅里葉變換紅外光譜顯示，表面層的改性對應於離子在聚合物中的穿透深度（約70納米）。然而，對深層進行清洗及後續測量表明，在薄改性層中形成的自由基會遷移至本體層，並導致深層聚苯乙烯化學結構發生一系列變化。因此，儘管離子在聚苯乙烯薄膜中的穿透深度較小，但整個薄膜的改性深度遠大於離子的投影射程。由此可見，聚合物離子束處理僅在特定條件下屬於表面改性方法，必須考慮自由基反應及其向聚合物深層遷移的可能性。

摘要

原文標題：The Scalar Size of the Pion from Lattice QCD
中文標題：格點QCD中π介子標量大小的計算
發布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分類：hep-lat, hep-ph
原文鏈接：http://arxiv.org/abs/2503.20687v1

中文摘要：我們提出了一種系統誤差完全受控的格點QCD計算，用於確定π介子標量形狀因子及相關半徑。計算結果基於17組N_f=2+1 威爾遜Clover 改進海夸克的規範系綜，這些系綜覆蓋了從a=0.049fm到a=0.086fm四種格點間距、130-350MeV的π介子質量範圍以及多種物理體積。通過對著名的夸克斷開貢獻的精確測定，我們首次在物理夸克質量附近的大尺度精細系綜上實現了形狀因子前所未有的動量分辨率。採用1.0fm≲t_sep≲3.25fm的大範圍源匯間距，可靠地提取了零動量轉移和非零動量轉移下的相關基態矩陣元。這使得我們首次能夠通過所得形狀因子 Q^2依賴性的z-展開參數化（而非小動量轉移下的簡單線性近似）來獲取標量半徑。使用三味NLO 手征微擾理論對半徑進行物理外推，通過三個低能常數（包括首次格點測定的L_4^r）參數化夸克質量依賴性。基於赤池信息準則的模型平均方法，我們對基態提取、形狀因子參數化以及物理外推等環節產生的系統誤差進行了量化處理。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數最大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：我們研究一維高斯位置混合的非參數極大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定n個數據點時該估計量總是返回最多含n個分量的混合分布，而近期(Wu-Polyanskiy, 2020)對亞高斯數據給出了精確的$O(\log n)$界。本文研究$\widehat{\pi}$的計算特性：我們提出一種算法，當$\varepsilon>0$足夠小時，可在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算得到$\widehat\pi$的Wasserstein距離$\varepsilon$-近似解。其中$K$與數據相關但與$\varepsilon$無關，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子數。我們還可在有限時間內確定性計算$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有密度函數（相對於Lebesgue測度）的概率分布獨立採樣生成時，這些保證幾乎必然成立。我們還證明：當$k\leq \sqrt{n}/3$時，限定為k原子分布的$\widehat\pi$條件分布在相應$2k-1$維參數空間上存在密度函數，且EM算法幾乎必然具有局部線性收斂性。關鍵工具之一是針對非退化曲線的經典傅里葉分析估計。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子勢的聚合物電解質膜質子傳輸大規模長時原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢（MLIPs）作為一種能夠實現大規模、長時間原子模擬並保持與基於密度泛函理論（DFT）和從頭算波函數理論的電子結構計算相當精度的方法，受到了廣泛關注。然而，基於MLIP的分子動力學（MD）模擬面臨的挑戰是其穩定性低於傳統經典勢函數。分析高度異質體系或非晶材料通常需要大規模長時間模擬，因此必須開發能夠實現穩定MD模擬的魯棒性MLIPs。本研究利用我們的神經網絡勢（NNP）生成器，構建了一個能夠在廣泛水合水平範圍內對全氟離聚物膜（Nafion）進行大規模長時間MD模擬的NNP模型。通過主動學習循環迭代擴展數據集，我們成功建立了魯棒的深度勢（DP）模型。具體而言，通過將非平衡DPMD模擬採樣的非平衡結構與結合最小原子間距的三維結構特徵空間篩選相結合，可顯著提升DP模型的魯棒性，從而實現對約10,000至20,000原子的大型Nafion體系進行長達31納秒的穩定MD模擬。採用所開發DP模型的MD模擬獲得的氫原子自擴散係數，在廣泛水合水平範圍內比先前小體系從頭算MD模擬結果更接近實驗值。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：一個開放、快速、可靠且高效的每日任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過將地址複製到多個位置來實現（例如）降低延遲和增強韌性。由於任播在現代互聯網中的關鍵作用，先前研究已開發了執行任播普查的工具。首個工具iGreedy利用地理分散位置的延遲測量來映射任播部署；第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——可在3小時內完成全網普查，但存在準確性和精確性問題。相反，iGreedy精度極高但速度較慢，且探測成本更高。本文針對這兩個系統的缺陷，提出了MAnycast Reloaded（MAnycastR）。以MAnycast2為基礎，我們徹底重新設計了其測量管道，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持，以及類似iGreedy的延遲測量功能。我們在含32個全球分布式節點的任播測試平台上驗證MAnycastR，與外部任播生產部署對比，並通過RIPE Atlas進行廣泛延遲測量，同時將檢測到的60%以上任播前綴與運營商真實數據交叉核驗。結果表明MAnycastR實現了高準確性與精確度。我們以寬鬆開源協議向社區提供每日持續的MAnycastR普查數據，並公開該工具的源代碼。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：基於屬性圖的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：給定圖$G$和種子節點$v_s$，局部圖聚類（LGC）的目標是在與$C_s$大小大致成線性關係的時間內，識別出圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖的應用場景。然而，現有解決方案大多僅依賴圖中節點的拓撲連接性，容易受到現實圖數據中普遍存在的缺失或噪聲鏈接的影響。為解決該問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC問題建模為雙向擴散分布（BDD）的估計問題，該模型專門用於捕捉含屬性圖中節點的多跳關聯性。進一步提出LACA方法——一種高效且具備強局部性的LGC解決方案，在多個真實數據集上表現出卓越性能。其核心組件包括：（i）基於理論基礎的快速節點屬性預處理技術；（ii）具備嚴格理論保證和加速收斂特性的自適應向量擴散算法；（iii）高效的三步式BDD近似方案。通過在8個真實數據集上與17種對比方法的實驗表明，LACA在真實局部簇的評估指標上全面優於所有對比方法，同時速度提升達數量級。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重構動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會新陳代謝系統。SCN絕非靜態存在，而是通過企業的進出與供應關係的重組持續演變。本研究利用獨特數據集追蹤了一個國家SCN中企業及其供需關係的時序演化。基於匈牙利2014至2022年每月增值稅數據，我們重建了包含711,248家企業和38,644,400條連接的整體經濟網絡，實現了企業級分辨率的經濟結構全息記錄。研究發現：每年約25%企業退出SCN，同時28%新企業進入；平均55%的年度供應關係會在次年消失；供應關係的半衰期為13個月。新連接以超偏好依附概率$p(i)\propto k_i^{1.08}$（$k_i$為企業i的連接數）形成。我們校準的簡易統計網絡生成模型成功復現了匈牙利主導SCN的典型特徵，不僅能再現入/出度分布、同配性和聚類結構等局部特徵，還能捕捉真實的系統性風險輪廓。最後探討了經濟網絡重連動力學對量化系統韌性和估計衝擊傳導的關鍵作用。

摘要

原文標題：Ion beam treatment of thick polystyrene films
中文標題：厚聚苯乙烯薄膜的離子束處理
發布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分類：physics.chem-ph
原文鏈接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋塗厚度為78納米至1.3微米的不同厚度聚苯乙烯薄膜，採用能量為20 keV的氮離子束進行處理。橢偏儀測量和傅里葉變換紅外光譜顯示，表面層的改性對應於離子在聚合物中的穿透深度（約70納米）。然而，對深層進行清洗和後續測量表明，在薄改性層中形成的自由基會遷移到本體層中，並導致深層聚苯乙烯層的化學結構發生一系列變化。因此，儘管離子在聚苯乙烯薄膜中的穿透深度較小，但整個薄膜的改性深度遠大於離子的投影射程。因此，離子束處理聚合物僅在特定條件下可視為表面改性方法。必須考慮自由基反應及其向聚合物深層遷移的可能性。

摘要

原文標題：The Scalar Size of the Pion from Lattice QCD
中文標題：格點QCD中π介子標量大小的計算
發布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分類：hep-lat, hep-ph
原文鏈接：http://arxiv.org/abs/2503.20687v1

中文摘要：我們提出了一種系統誤差完全受控的格點QCD計算，用於確定π介子標量形狀因子及相關半徑。計算結果基於17個規範場組態的大規模集合，採用$N_f=2+1$ Wilson-Clover改進海夸克。這些組態覆蓋了從$a=0.049\mathrm{fm}$到$a=0.086\mathrm{fm}$四種格距，$130-350\mathrm{MeV}$的π介子質量範圍以及多種物理體積。通過對著名的夸克不連通貢獻的精確測定，我們首次在接近物理夸克質量的大尺寸精細組態上實現了形狀因子前所未有的動量分辨率。採用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$範圍內多種源匯間距，可靠地提取了零動量轉移和非零動量轉移下的基態矩陣元。這使得我們能夠首次通過所得形狀因子$Q^2$依賴性的$z$展開參數化（而非小動量轉移下的簡單線性近似）獲取標量半徑。半徑的物理外推採用三味NLO手征微擾理論，以三個低能常數（包括$L_4^r$的首次格點測定結果）參數化夸克質量依賴性。通過基於赤池信息準則的模型平均方法，系統評估了基態提取、形狀因子參數化以及物理外推對最終結果的系統不確定性。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數極大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：我們研究一維高斯位置混合的非參數最大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定n個數據點，該估計量總是返回最多含n個分量的混合分布；近期(Wu-Polyanskiy, 2020)對次高斯數據給出了精確的$O(\log n)$界。本文研究$\widehat{\pi}$的計算特性：我們提出一種算法，當$\varepsilon>0$足夠小時，可在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算Wasserstein距離下的$\varepsilon$近似解，其中$K$與數據相關但與$\varepsilon$無關，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$是$\widehat\pi$的原子數。我們還可在有限時間內確定性計算$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$來自具有密度（相對於Lebesgue測度）的概率分布時，這些保證幾乎必然成立。我們還證明：當$k\leq \sqrt{n}/3$時，限定為k原子分布的$\widehat\pi$在相關$2k-1$維參數空間上具有密度，且EM算法幾乎必然局部線性收斂。關鍵工具之一是非退化曲線的經典傅里葉分析估計。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子間勢的聚合物電解質膜質子傳輸大規模長時原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢（MLIPs）作為一種能夠實現大規模、長時間原子模擬的方法備受關注，同時保持與基於密度泛函理論（DFT）和從頭算波函數理論的電子結構計算相當的精度。然而，基於MLIP的分子動力學（MD）模擬面臨的挑戰是其穩定性低於使用傳統經典勢的模擬。分析高度異質系統或無定形材料通常需要大規模和長時間的模擬，因此需要開發能夠進行穩定MD模擬的魯棒MLIPs。在本研究中，我們利用神經網絡勢（NNP）生成器，構建了一個NNP模型，能夠在廣泛水合水平範圍內對全氟離子交換膜（Nafion）進行大規模、長時間的MD模擬。通過主動學習循環迭代擴展數據集，我們成功構建了一個魯棒的深度勢（DP）模型。具體而言，通過結合非平衡DPMD模擬採樣的非平衡結構與包含最小原子間距離的3D結構特徵空間中的結構篩選，可以顯著增強DP模型的魯棒性，從而實現對大約10,000至20,000個原子的大型Nafion系統進行長達31 ns的穩定MD模擬。採用所開發DP模型的MD模擬得到的氫原子自擴散係數，在廣泛水合水平範圍內與實驗值更為接近，優於先前對小系統進行的從頭算MD模擬結果。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：一個開放、快速、可靠且高效的每日任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過將地址複製到多個位置來實現降低延遲和增強韌性等目標。由於任播在現代互聯網中的關鍵作用，先前研究已開發了多種任播普查工具。首款工具iGreedy通過地理分散位置的延遲測量來繪製任播部署圖；第二款工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度，可在3小時內完成全網普查，但存在準確性和精確度問題。相反，iGreedy精度極高但速度較慢，且探測成本更高。本文針對這兩個系統的缺陷提出了MAnycast Reloaded（MAnycastR）。以MAnycast2為基礎，我們徹底重構了其測量流程，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持以及類似iGreedy的延遲測量功能。我們在含32個全球分布式節點的任播測試平台上驗證MAnycastR，與外部任播生產部署進行對比，並通過RIPE Atlas進行廣泛延遲測量，同時針對60%以上檢測到的任播前綴與運營商真實數據進行交叉驗證。結果表明MAnycastR實現了高準確性和精確度。我們將持續提供每日MAnycastR普查數據，並以寬鬆開源協議發布工具源代碼。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：基於屬性圖的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：給定圖$G$和種子節點$v_s$，局部圖聚類（LGC）的目標是在與$C_s$大小大致成線性關係的時間內，識別出圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖的應用場景。然而，現有解決方案大多僅依賴圖中節點的拓撲連接性，容易受到現實圖數據中普遍存在的缺失或噪聲鏈接的影響。為解決該問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC建模為雙向擴散分布（BDD）的估計問題，該模型專門用於捕捉帶屬性節點的多跳關聯性。進一步提出LACA方法——一種高效且具備嚴格理論保證的LGC算法，其核心包括：(i) 基於理論基礎的快速節點屬性預處理技術，(ii) 具有自適應擴散能力且保證加速收斂的向量傳播算法，(iii) 高效的三步式BDD近似方案。在8個真實數據集上與17種對比方法的實驗表明，LACA在真實局部簇的評估指標上全面優於所有基線方法，同時實現數量級的速度提升。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重構動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會新陳代謝系統。供應鏈網絡絕非靜態，而是通過企業的進出和供應關係的重組不斷變化。本文利用獨特數據集研究了一個國家供應鏈網絡中企業及其供應商-買方關係的時間演化。基於匈牙利2014至2022年每月申報的增值稅數據，我們重建了包含711,248家企業和38,644,400條連接的整體經濟網絡，以企業級分辨率覆蓋了幾乎所有的經濟重構事件。研究發現：每年約25%的企業退出供應鏈網絡，同時28%的新企業加入；平均55%的現存供應鏈接會在次年消失；供應鏈接的半衰期為13個月。新鏈接以超偏好依附方式連接企業，概率滿足$p(i)\propto k_i^{1.08}$（$k_i$表示企業$i$的供應連接數）。我們校準了一個能復現匈牙利主導供應鏈網絡典型特徵的簡單統計網絡生成模型，該模型不僅復現了入/出度分布、同配性和聚類結構等局部網絡特徵，還捕捉了真實的系統性風險特徵。最後討論了該模型如何通過經濟網絡的重連動態來量化其韌性並評估衝擊傳播。

摘要

原文標題：Ion beam treatment of thick polystyrene films
中文標題：厚聚苯乙烯薄膜的離子束處理
發布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分類：physics.chem-ph
原文鏈接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋塗厚度為78納米至1.3微米的不同厚度聚苯乙烯薄膜，並用能量為20 keV的氮離子進行處理。橢圓偏振測量和傅里葉變換紅外光譜顯示，表面層的改性對應於離子在聚合物中的穿透深度（約70納米）。然而，對深層進行清洗和後續測量表明，在薄改性層中形成的自由基遷移到體層中，並引起深層聚苯乙烯化學結構的多種變化。因此，儘管離子在聚苯乙烯薄膜中的穿透深度較小，但整個薄膜的改性深度遠大於離子的投影射程。因此，離子束處理聚合物僅在特定條件下是一種表面改性方法。必須考慮自由基反應及其向聚合物深層遷移的可能性。

摘要

原文標題：The Scalar Size of the Pion from Lattice QCD
中文標題：格點QCD中π介子的標量大小
發布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分類：hep-lat, hep-ph
原文鏈接：http://arxiv.org/abs/2503.20687v1

中文摘要：我們提出了一種系統誤差完全受控的格點QCD計算，用於確定π介子標量形狀因子及相關半徑。計算結果基於17個規範系綜的大規模數據集，這些系綜採用$N_f=2+1$ Wilson Clover改進的海夸克配置。這些系綜覆蓋了從$a=0.049\mathrm{fm}$到$a=0.086\mathrm{fm}$的四種格點間距、$130-350\mathrm{MeV}$的π介子質量範圍以及多種物理體積。通過精確計算著名的夸克斷開貢獻，我們首次在接近物理夸克質量的大尺寸精細系綜上實現了形狀因子前所未有的動量分辨率。採用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$的寬範圍源匯分離距離，可靠地提取了零動量轉移和非零動量轉移下的基態矩陣元。這使得我們能夠首次通過所得形狀因子$Q^2$依賴性的$z$展開參數化（而非小動量轉移下的簡單線性近似）獲得標量半徑。半徑的物理外推採用三味NLO手征微擾理論，以三個低能常數（包括$L_4^r$的首個格點測定值）參數化夸克質量依賴性。通過基於赤池信息準則的模型平均方法，系統評估了基態提取、形狀因子參數化以及物理外推對最終結果的系統不確定性影響。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數最大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：我們研究一維高斯位置混合模型的非參數極大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定包含$n$個數據點的數據集，該估計量總是返回最多包含$n$個分量的混合模型；而近期(Wu-Polyanskiy, 2020)對次高斯數據給出了嚴格的$O(\log n)$界。本文重點研究$\widehat{\pi}$的計算特性：我們提出一種算法，當$\varepsilon>0$足夠小時，可在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算出Wasserstein距離意義上的$\varepsilon$近似解$\widehat\pi$。其中$K$與數據相關但與$\varepsilon$無關，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子數量。我們還可在有限時間內確定性計算$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$中的點獨立採樣自具有（相對於勒貝格測度的）密度函數的概率分布時，這些保證幾乎必然成立。我們還證明：當$k\leq \sqrt{n}/3$時，限定為$k$原子結構的$\widehat\pi$條件分布在相關$2k-1$維參數空間上具有密度函數，且EM算法幾乎必然具有局部線性收斂性。其中關鍵工具是非退化曲線的經典傅里葉分析估計。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子勢的聚合物電解質膜質子傳輸大規模長時原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢（MLIPs）作為一種能夠實現大規模、長時間原子模擬的方法受到廣泛關注，其精度可與基於密度泛函理論（DFT）和從頭算波函數理論的電子結構計算相媲美。然而，基於MLIP的分子動力學（MD）模擬存在穩定性低於傳統經典勢函數的挑戰。分析高度異質體系或非晶材料通常需要大規模長時間模擬，因此必須開發能夠實現穩定MD模擬的魯棒性 MLIP。本研究利用我們的神經網絡勢（NNP）生成器，構建了一個NNP模型，可在廣泛水合水平範圍內對全氟離聚物膜（Nafion）進行大規模長時間MD模擬。通過主動學習循環迭代擴展數據集，我們成功建立了魯棒的深度勢（DP）模型。具體而言，通過將非平衡 DPMD模擬採樣的非平衡結構與結合最小原子間距的三維結構特徵空間篩選相結合，可顯著增強DP模型的魯棒性，從而實現對約10,000至20,000原子的大型Nafion體系進行長達31 ns的穩定MD模擬。採用所開發DP模型的MD模擬獲得的氫原子自擴散係數，在廣泛水合水平範圍內比先前小體系從頭算 MD模擬結果更接近實驗值。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：開放、快速、可靠且高效的每日任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過將地址複製到多個位置來實現降低延遲和增強韌性等目標。由於任播在現代互聯網中的關鍵作用，先前研究已開發了多種任播普查工具。首款工具iGreedy通過地理分散節點的延遲測量來繪製任播部署圖；第二款工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——可在3小時內完成全網普查，但存在準確性和精確度問題；而iGreedy雖然高度準確，但速度較慢且探測成本更高。本文針對這兩個系統的缺陷提出了MAnycast Reloaded（MAnycastR）。我們在MAnycast2基礎上完全重構了其測量管道，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持以及類似iGreedy的延遲測量功能。通過在含32個全球分布式節點的任播測試平台進行驗證，與外部任播生產部署對比，結合RIPE Atlas的廣泛延遲測量，並對檢測到的60%以上任播前綴進行運營商數據交叉核驗，證明MAnycastR具備高準確性和精確度。我們將持續提供每日MAnycastR普查數據，並以寬鬆開源協議發布工具源代碼。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：基於屬性圖的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：給定圖$G$和種子節點$v_s$，局部圖聚類(LGC)的目標是在與$C_s$大小大致成線性關係的時間內，識別出圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖的應用場景。然而，現有解決方案大多僅依賴圖中節點的拓撲連接性，容易受到現實圖數據中普遍存在的缺失鏈接或噪聲鏈接的影響。為解決這一問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC建模為雙向擴散分布(BDD)的估計問題，該模型專門用於捕捉帶屬性節點的多跳關聯性。進一步提出LACA方法——一種高效且具備強局部性的LGC解決方案，在多個真實數據集上表現出卓越性能。其核心組件包括：(i) 基於理論基礎的快速節點屬性預處理技術；(ii) 具有嚴格理論保證和加速收斂特性的自適應向量擴散算法；(iii) 高效的三步式BDD近似方案。通過在8個真實數據集上與17種對比方法的實驗表明，LACA在真實局部簇的評估指標上全面優於所有對比方法，同時速度提升可達數量級。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重構動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會新陳代謝系統。供應鏈網絡絕非靜態存在，而是通過企業的進出和供應關係的重組不斷變化。本文利用獨特數據集研究了一個國家供應鏈網絡中企業及其供應商-客戶關係的時間演化。基於匈牙利2014至2022年每月報告的增值稅數據，我們重建了包含711,248家企業和38,644,400條連接的整體經濟網絡，以企業級分辨率覆蓋了幾乎整個經濟體的所有重構事件。研究發現：每年約25%的企業退出供應鏈網絡，同時28%的新企業加入；平均而言，當年存在的供應鏈接中有55%會在次年消失；供應鏈接的半衰期為13個月。新鏈接以超偏好依附概率$p(i)\propto k_i^{1.08}$（$k_i$表示企業i的供應連接數）附着於企業。我們校準了一個能復現匈牙利主導供應鏈網絡典型特徵的簡單統計網絡生成模型，該模型不僅復現了入/出度分布、同配性和聚類結構等局部網絡特徵，還捕捉了真實的系統性風險特徵。最後討論了當前模型如何通過經濟重連動態來量化其韌性並估計衝擊傳導。

摘要

原文標題：Ion beam treatment of thick polystyrene films
中文標題：厚聚苯乙烯薄膜的離子束處理
發布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分類：physics.chem-ph
原文鏈接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋塗厚度從78納米至1.3微米不等的聚苯乙烯薄膜，經20 keV 氮離子束處理後，橢偏儀測量和傅里葉變換紅外光譜顯示表面改性層深度與離子在聚合物中的穿透深度（約70納米）相符。然而，深層洗滌及後續測試表明，薄改性層中形成的自由基會遷移至本體層，導致深層聚苯乙烯發生一系列化學結構變化。因此，儘管離子在聚苯乙烯薄膜中的穿透深度有限，整個薄膜的改性深度卻遠超過離子投影射程。這表明離子束處理僅能有條件地視為表面改性方法，必須考慮自由基反應及其向聚合物深層遷移的可能性。

摘要

原文標題：The Scalar Size of the Pion from Lattice QCD
中文標題：格點QCD中π介子的標量大小
發布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分類：hep-lat, hep-ph
原文鏈接：http://arxiv.org/abs/2503.20687v1

中文摘要：我們提出了一種系統誤差完全受控的格點QCD計算，用於確定π介子標量形狀因子及相關半徑。計算結果基於17組Nf=2+1 威爾遜-克拉夫改進海夸克的規範系綜，涵蓋0.049-0.086fm四種晶格間距、130-350MeVπ介子質量範圍及多種物理體積。通過對著名夸克斷開貢獻的精確測定，首次在接近物理夸克質量的大尺寸精細系綜上實現了形狀因子前所未有的動量分辨率。採用1.0-3.25fm寬範圍的源匯分離距離，可靠地提取了零動量轉移與非零動量轉移下的基態矩陣元。這使得我們首次能通過所得形狀因子Q²依賴性的z-展開參數化（而非小動量轉移下的簡單線性近似）獲取標量半徑。使用三味NLO 手征微擾理論對半徑進行物理外推，以三個低能常數（包括L₄ʳ的首個格點測定值）參數化夸克質量依賴性。通過基於赤池信息準則的模型平均，量化了基態提取、形狀因子參數化及物理外推等環節對最終結果的系統不確定性。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數極大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：摘要：我們研究一維高斯位置混合的非參數最大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定n個數據點，該估計量總是返回最多含n個分量的混合分布，而近期(Wu-Polyanskiy, 2020)對次高斯數據給出了嚴格的$O(\log n)$界。本文研究$\widehat{\pi}$的計算特性：提出一種算法，當$\varepsilon>0$足夠小時，可在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算Wasserstein距離下的$\varepsilon$近似解，其中$K$依賴數據但獨立於$\varepsilon$，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$是$\widehat\pi$的原子數。我們還可在有限時間內確定性計算$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$來自具有密度（相對於Lebesgue測度）的概率分布時，這些保證幾乎必然成立。我們還證明：當$k\leq \sqrt{n}/3$時，限定為k原子分布的$\widehat\pi$在相關$2k-1$維參數空間上具有密度，且EM算法幾乎必然局部線性收斂。關鍵工具之一是非退化曲線的經典傅里葉分析估計。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子勢的聚合物電解質膜質子傳輸大規模長時原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢（MLIPs）作為一種能夠實現大規模、長時間原子尺度模擬的方法，同時保持與基於密度泛函理論（DFT）和從頭算波函數理論的電子結構計算相當的精度，引起了廣泛關注。然而，基於MLIP的分子動力學（MD）模擬面臨的挑戰是其穩定性低於使用傳統經典勢的模擬。分析高度異質體系或非晶材料通常需要大規模和長時間的模擬，因此必須開發能夠進行穩定MD模擬的魯棒MLIP。在本研究中，我們利用自研的神經網絡勢（NNP）生成器，構建了一個NNP模型，能夠對全氟離聚物膜（Nafion）在不同水合水平下進行大規模、長時間的MD模擬。通過主動學習循環迭代擴展數據集，我們成功建立了魯棒的深度勢（DP）模型。具體而言，通過將非平衡 DPMD模擬採樣的非平衡結構與結合最小原子間距的三維結構特徵空間中的結構篩選相結合，可顯著提升DP模型的魯棒性，從而實現對約10,000至20,000個原子的大型Nafion體系進行長達31 ns的穩定MD模擬。採用所開發DP模型的MD模擬獲得的氫原子自擴散係數，在廣泛水合水平範圍內比先前小體系從頭算MD模擬結果更接近實驗值。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：開放、快速、可靠且高效的每日任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過將地址複製到多個位置來實現降低延遲和增強韌性等目標。由於任播在現代互聯網中的關鍵作用，先前研究已開發了執行任播普查的工具。首個工具iGreedy利用地理分散位置的延遲測量來繪製任播部署圖；第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——可在3小時內完成全網普查，但存在準確性和精確度問題。相反，iGreedy精度極高但速度較慢，且探測成本更高。本文針對這兩個系統的缺陷提出了MAnycast Reloaded（MAnycastR）。以MAnycast2為基礎，我們徹底重新設計了其測量流水線，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持以及類似iGreedy的延遲測量功能。我們在包含32個全球分布式節點的任播測試平台上驗證MAnycastR，與外部任播生產部署進行對比，並通過RIPE Atlas進行廣泛延遲測量，同時對檢測到的60%以上任播前綴與運營商真實數據進行交叉驗證。結果表明MAnycastR實現了高準確性和精確度。我們以寬鬆的開源許可向社區提供每日持續的MAnycastR普查數據，並發布該工具的源代碼。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：基於屬性圖的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：給定圖$G$和種子節點$v_s$，局部圖聚類（LGC）的目標是在與$C_s$大小大致成線性關係的時間內，識別出圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖的應用場景。然而，現有解決方案大多僅依賴圖中節點的拓撲連接性，容易受到現實圖數據中普遍存在的缺失或噪聲鏈接的影響。為解決該問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC建模為雙向擴散分布（BDD）的估計問題，該模型專門用於捕捉帶屬性節點的多跳關聯性。進一步提出LACA方法——一種高效且具備嚴格理論保證的LGC 算法，其核心包括：(i) 快速且理論完備的節點屬性預處理技術；(ii) 具有自適應擴散能力和加速收斂特性的向量傳播算法；(iii) 高效的三步式 BDD 近似方案。在8個真實數據集上與17種基線方法的對比實驗表明，LACA在真實局部簇的評估指標上全面優於所有對比方法，同時速度提升達數量級。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重連動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成了任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會新陳代謝系統。供應鏈網絡絕非靜態存在，而是通過企業的進出和供應關係的重組不斷變化。本研究利用獨特數據集追蹤了一個國家供應鏈網絡中企業及其供應商-客戶關係的時間演化。基於匈牙利2014至2022年每月報告的增值稅數據，我們重建了包含711,248家企業和38,644,400條連接的整體經濟網絡，以企業級分辨率覆蓋了幾乎整個經濟體的所有重構事件。研究發現：每年約25%的企業退出供應鏈網絡，同時28%的新企業加入；平均55%的現存供應鏈接會在次年消失；供應鏈接的半衰期為13個月。新鏈接以超偏好依附概率$p(i)\propto k_i^{1.08}$（$k_i$表示企業i的供應連接數）附着於企業。我們校準了一個能復現匈牙利主導供應鏈網絡典型特徵的簡單統計網絡生成模型，該模型不僅復現了入/出度分布、同配性和聚類結構等局部網絡特徵，還捕捉了真實的系統性風險特徵。最後討論了當前模型如何通過經濟重連動態來量化系統韌性和估計衝擊傳導。

摘要

原文標題：Ion beam treatment of thick polystyrene films
中文標題：厚聚苯乙烯薄膜的離子束處理
發布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分類：physics.chem-ph
原文鏈接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋塗厚度為78納米至1.3微米的不同厚度聚苯乙烯薄膜，並用能量為20 keV的氮離子進行處理。橢偏儀測量和傅里葉變換紅外光譜顯示，表面層的改性對應於離子在聚合物中的穿透深度（約70納米）。然而，對深層進行清洗和後續測量表明，在薄改性層中形成的自由基會遷移到本體層中，並引起深層聚苯乙烯層化學結構的多種變化。因此，儘管離子在聚苯乙烯薄膜中的穿透深度較小，但整個薄膜的改性深度遠大於離子的投影射程。因此，離子束處理聚合物僅在特定條件下是一種表面改性方法。必須考慮自由基反應及其向聚合物深層遷移的可能性。

摘要

原文標題：The Scalar Size of the Pion from Lattice QCD
中文標題：格點QCD中π介子的標量大小
發布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分類：hep-lat, hep-ph
原文鏈接：http://arxiv.org/abs/2503.20687v1

中文摘要：我們提出了一種系統誤差完全受控的格點QCD計算，用於確定π介子標量形狀因子及相關半徑。計算結果基於包含17個規範系綜的大規模數據集，這些系綜採用$N_f=2+1$威爾遜Clover改進海夸克。所涉系綜覆蓋$0.049\mathrm{fm}$至$0.086\mathrm{fm}$四種格距、$130-350\mathrm{MeV}$的π介子質量範圍及多種物理體積。通過精確計算著名的夸克斷開貢獻，首次在接近物理夸克質量的大尺寸精細系綜上實現了形狀因子前所未有的動量分辨率。採用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$的大範圍源匯間距，可靠地提取了零動量轉移與非零動量轉移下的基態矩陣元。這使得我們首次能通過所得形狀因子$Q^2$依賴性的$z$展開參數化（而非小動量轉移下的簡單線性近似）獲取標量半徑。半徑的物理外推採用三味NLO手征微擾理論，以三個低能常數（包括$L_4^r$的首個格點測定值）參數化夸克質量依賴性。通過基於赤池信息準則的模型平均方法，系統評估了基態提取、形狀因子參數化及物理外推等環節對最終結果的系統不確定性。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數最大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：我們研究一維高斯位置混合的非參數極大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定n個數據點時，該估計量始終返回最多含n個分量的混合分布；近期(Wu-Polyanskiy, 2020)更對次高斯數據給出了嚴格的$O(\log n)$界。本文重點研究$\widehat{\pi}$的計算特性：我們提出一種算法，當$\varepsilon>0$足夠小時，可在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算出Wasserstein距離意義上的$\varepsilon$近似解，其中$K$與數據相關但與$\varepsilon$無關，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子數。我們還可在有限時間內確定性計算出$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$中的點獨立採樣自具有Lebesgue測度密度的概率分布時，這些保證幾乎必然成立。我們進一步證明：當$k\leq \sqrt{n}/3$時，限定為k原子分布的$\widehat\pi$條件分布在相應$2k-1$維參數空間上存在密度，且EM算法幾乎必然具有局部線性收斂性。關鍵工具之一是對非退化曲線的經典傅里葉分析估計。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子勢的大規模長時質子交換膜質子傳輸原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢（MLIPs）作為一種能夠實現大規模、長時間原子尺度模擬的方法，同時保持與基於密度泛函理論（DFT）和從頭算波函數理論的電子結構計算相當的精度，引起了廣泛關注。然而，基於MLIP的分子動力學（MD）模擬面臨的挑戰是其穩定性低於使用傳統經典勢的模擬。分析高度異質體系或非晶材料通常需要大規模和長時間的模擬，因此需要開發能夠實現穩定MD模擬的魯棒MLIP。在本研究中，我們利用自研的神經網絡勢（NNP）生成器，構建了一個NNP模型，該模型能夠對全氟磺酸離子膜（Nafion）在不同水合水平下進行大規模、長時間的MD模擬。通過主動學習循環迭代擴展數據集，我們成功建立了魯棒的深度勢（DP）模型。具體而言，通過將非平衡DPMD模擬採樣的非平衡結構與結合最小原子間距的三維結構特徵空間中的結構篩選相結合，可顯著提升DP模型的魯棒性，從而實現對約10,000至20,000個原子的大型Nafion體系進行長達31 ns的穩定MD模擬。採用所開發DP模型的MD模擬獲得的氫原子自擴散係數，在廣泛水合水平範圍內比先前小體系從頭算MD模擬結果更接近實驗值。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：開放、快速、可靠且高效的每日任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過將地址複製到多個位置來實現（例如）降低延遲和增強韌性。由於任播在現代互聯網中的關鍵作用，先前研究已開發了執行任播普查的工具。首個工具iGreedy利用地理分散位置的延遲測量來映射任播部署；第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——可在3小時內完成全網普查，但存在準確性和精確性問題。相反，iGreedy精度極高但速度較慢，且探測成本更高。本文針對這兩個系統的缺陷，提出了MAnycast Reloaded（MAnycastR）。我們以MAnycast2為基礎，徹底重構其測量流程，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持，以及類似iGreedy的延遲測量功能。通過在含32個全球分布式節點的任播測試床上驗證MAnycastR，與外部任播生產部署對比，結合RIPE Atlas的廣泛延遲測量，並對檢測到的任播前綴中超過60%進行運營商真實數據交叉驗證，結果表明MAnycastR實現了高準確性與精確度。我們將持續提供每日MAnycastR普查數據，並以寬鬆開源協議發布工具源代碼。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：基於屬性圖的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：給定圖$G$和種子節點$v_s$，局部圖聚類（LGC）的目標是在與$C_s$大小近似線性相關的時間內，識別出圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖的應用場景。然而現有方案大多僅依賴圖中節點的拓撲連接性，容易受到現實圖譜中普遍存在的缺失鏈接或噪聲鏈接的影響。為解決該問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC建模為雙向擴散分布（BDD）的估計問題，該模型專門用於捕捉含屬性節點間的多跳親和力。進一步提出LACA方法——一種高效且具備嚴格理論保證的LGC方案，其核心組件包括：(i) 基於理論基礎的快速節點屬性預處理技術；(ii) 具有理論保證和加速收斂特性的自適應向量擴散算法；(iii) 高效的三步式BDD近似方案。在8個真實數據集上與17種對比方法的實驗表明，LACA在真實局部簇的衡量標準下均優於所有對比方法，同時速度提升達數量級。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重連動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成了任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會新陳代謝系統。供應鏈網絡絕非靜態存在，而是通過企業的進入退出與供應關係的重組持續演變。本研究利用獨特數據集追蹤了一個國家供應鏈網絡中企業及其供應商-客戶關係的時間演化。基於匈牙利2014至2022年按月申報的增值稅數據，我們重建了包含711,248家企業和38,644,400條連接的整體經濟網絡，以企業級分辨率覆蓋了幾乎所有的經濟結構調整事件。研究發現：每年約25%的企業退出供應鏈網絡，同時28%的新企業加入；平均而言，當年存在的供應鏈接中有55%會在次年消失；供應鏈接的半衰期為13個月。新鏈接以超偏好依附方式連接企業，概率滿足$p(i)\propto k_i^{1.08}$（$k_i$表示企業$i$的供應連接數）。我們校準了一個能復現匈牙利主導供應鏈網絡典型特徵的簡易統計網絡生成模型，該模型不僅再現了入/出度分布、同配性和聚類結構等局部網絡特徵，還捕捉到真實的系統性風險輪廓。最後探討了經濟重連動態對量化系統韌性和估計衝擊傳導的關鍵作用。

摘要

原文標題：Ion beam treatment of thick polystyrene films
中文標題：厚聚苯乙烯薄膜的離子束處理
發布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分類：physics.chem-ph
原文鏈接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋塗厚度為78 nm至1.3 μm的聚苯乙烯薄膜經20 keV氮離子束處理後，橢偏儀測量和傅里葉變換紅外光譜顯示表面改性層深度與離子在聚合物中的穿透深度（約70 nm）相符。然而，深層洗滌及後續測試表明，薄改性層中形成的自由基會遷移至本體層，導致深層聚苯乙烯化學結構發生系列變化。因此，儘管離子在聚苯乙烯膜中的穿透深度較淺，但整個薄膜的改性深度遠超離子投影射程。這表明離子束處理聚合物僅能視作表面改性方法是有條件的，必須考慮自由基反應及其向聚合物深層遷移的可能性。

摘要

原文標題：The Scalar Size of the Pion from Lattice QCD
中文標題：格點QCD中π介子的標量大小
發布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分類：hep-lat, hep-ph
原文鏈接：http://arxiv.org/abs/2503.20687v1

中文摘要：我們提出了一種系統誤差完全受控的格點QCD計算，用於確定π介子標量形狀因子及相關半徑。計算結果基於17組Nf=2+1 威爾遜Clover 改進海夸克的規範系綜，這些系綜覆蓋了0.049-0.086fm四種晶格間距、130-350MeV的π介子質量範圍及多種物理體積。通過對著名夸克斷開貢獻的精確測定，首次在接近物理夸克質量的大尺寸精細系綜上實現了形狀因子前所未有的動量分辨率。採用1.0-3.25fm寬範圍的源匯分離距離，可靠地提取了零動量轉移和非零動量轉移下的基態矩陣元。這使得我們首次能通過形狀因子 Q²依賴性的z展開參數化（而非小動量轉移下的簡單線性近似）獲得標量半徑。使用三味 NLO 手征微擾理論對半徑進行物理外推，以三個低能常數（包括L₄ʳ的首個格點測定結果）參數化夸克質量依賴性。通過基於赤池信息準則的模型平均方法，系統評估了基態提取、形狀因子參數化及物理外推等環節對最終結果的系統不確定性。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數極大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：我們研究一維高斯位置混合模型的非參數最大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定n個數據點時，該估計量始終返回最多含n個分量的混合模型；而近期(Wu-Polyanskiy, 2020)對亞高斯數據給出了嚴格的$O(\log n)$界。本文重點研究$\widehat{\pi}$的計算特性：我們提出的算法能在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算出Wasserstein距離意義下的$\varepsilon$近似解，其中$K$與數據相關但與$\varepsilon$無關，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子數。我們還可在有限時間內精確計算$|supp(\widehat\pi)|$值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$來自具有密度（相對於Lebesgue測度）的概率分布時，這些保證幾乎必然成立。我們還證明：當$k\leq \sqrt{n}/3$時，限定為k原子型的$\widehat\pi$條件分布在相關$2k-1$維參數空間上存在密度，且EM算法幾乎必然具有局部線性收斂性。關鍵工具之一是非退化曲線的經典傅里葉分析估計。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子勢的大規模長時質子交換膜質子傳輸原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢（MLIPs）作為一種能夠實現大規模、長時間原子模擬並保持與基於密度泛函理論（DFT）和從頭算波函數理論的電子結構計算相當精度的方法，受到廣泛關注。然而，基於MLIP的分子動力學（MD）模擬相較於傳統經典勢的模擬穩定性較低。分析高度異質體系或非晶材料通常需要大規模長時間模擬，因此亟需開發能夠實現穩定MD模擬的魯棒性 MLIPs。本研究利用我們的神經網絡勢（NNP）生成器，構建了一個能夠在廣泛水合水平下對全氟離聚物膜（Nafion）進行大規模長時間MD模擬的NNP模型。通過主動學習循環迭代擴展數據集，我們成功建立了魯棒的深度勢（DP）模型。具體而言，通過結合非平衡DPMD模擬的非平衡結構採樣與包含最小原子間距的三維結構特徵空間中的結構篩選，可顯著增強DP模型的魯棒性，從而實現對約10,000至20,000原子的大型Nafion體系進行長達31 ns的穩定MD模擬。採用所開發DP模型的MD模擬獲得的氫原子自擴散係數，在廣泛水合水平範圍內比先前較小體系的從頭算MD模擬更接近實驗值。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：開放、快速、可靠且高效的每日任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過在多位置複製地址來降低延遲並增強韌性。鑑於任播在現代互聯網中的關鍵作用，早期研究已開發出多種任播普查工具。首款工具iGreedy通過地理分散的延遲測量來繪製任播部署圖；第二款工具MAnycast2則利用任播技術對其他任播網絡進行普查，其優勢在於3小時內即可完成全網普查，但存在準確性和精度問題。反觀iGreedy雖精度極高但速度較慢，且探測成本顯著更高。本文針對兩套系統的缺陷，提出升級版MAnycast Reloaded（MAnycastR）。我們在MAnycast2基礎上徹底重構了測量管道，新增分布式探測支持、多協議（UDP/TCP/IPv6）兼容性以及類iGreedy的延遲測量功能。通過在含32個全球分布式節點的任播測試床進行驗證，與真實任播部署對比測試，並利用RIPE Atlas進行大規模延遲測量交叉檢驗（其中60%以上檢測到的任播前綴通過運營商數據覆核），證明MAnycastR具備高準確性與精確度。我們將持續提供每日任播普查數據，並以寬鬆開源協議發布工具源代碼。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：基於屬性圖的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：給定圖$G$和種子節點$v_s$，局部圖聚類（LGC）的目標是在與$C_s$大小大致成線性關係的時間內，識別出圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖的應用場景。然而，現有解決方案大多僅依賴圖中節點的拓撲連接性，容易受到現實圖數據中普遍存在的缺失或噪聲鏈接的影響。為解決該問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC建模為雙向擴散分布（BDD）的估計問題，該模型專門用於捕捉帶屬性節點的多跳關聯性。進一步提出LACA方法——一種高效且具備嚴格理論保證的LGC方案，其核心包括：(i) 基於理論基礎的快速節點屬性預處理技術；(ii) 具有自適應擴散能力和加速收斂特性的向量傳播算法；(iii) 高效的三步式BDD近似框架。在8個真實數據集上與17種對比方法的實驗表明，LACA在真實局部簇的評估指標上全面優於所有基線方法，同時速度提升達數量級。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重構動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成了任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會新陳代謝系統。SCN絕非靜態存在，而是通過企業的進出與供應關係的重組持續演變。本研究利用獨特數據集追蹤了一個國家SCN中企業及其供應商-客戶關係的時間演化。基於匈牙利2014至2022年每月報告的增值稅數據，我們重建了包含711,248家企業和38,644,400條連接的整體經濟網絡，實現了企業級分辨率下完整經濟體系重組事件的全面覆蓋。研究發現：每年約25%的企業退出SCN，同時28%的新企業加入；平均55%的現存供應鏈接會在次年消失；供應鏈接的半衰期為13個月。新鏈接以超偏好依附概率$p(i)\propto k_i^{1.08}$（$k_i$表示企業i的供應連接數）附着於企業。我們校準了一個能復現匈牙利主導SCN典型特徵的簡易統計網絡生成模型，該模型不僅再現了入度/出度分布、同配性和聚類結構等局部網絡特徵，還捕捉到真實的系統性風險輪廓。最後探討了經濟重連動態對量化系統韌性和評估衝擊傳導的關鍵作用。

摘要

原文標題：Ion beam treatment of thick polystyrene films
中文標題：厚聚苯乙烯薄膜的離子束處理
發布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分類：physics.chem-ph
原文鏈接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋塗厚度為78納米至1.3微米的不同厚度聚苯乙烯薄膜，並用能量為20 keV的氮離子進行處理。橢圓偏振測量和傅里葉變換紅外光譜顯示，表面層的改性對應於離子在聚合物中的穿透深度（約70納米）。然而，對深層進行清洗和後續測量表明，在薄改性層中形成的自由基遷移到體層中，並引起深層聚苯乙烯化學結構的多種變化。因此，儘管離子在聚苯乙烯薄膜中的穿透深度較小，但整個薄膜的改性深度遠大於離子的投影射程。因此，離子束處理聚合物僅在條件上是一種表面改性方法。必須考慮自由基反應及其向聚合物深層遷移的可能性。

摘要

原文標題：The Scalar Size of the Pion from Lattice QCD
中文標題：格點QCD中π介子的標量大小
發布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分類：hep-lat, hep-ph
原文鏈接：http://arxiv.org/abs/2503.20687v1

中文摘要：我們提出了一種系統誤差完全受控的格點QCD計算，用於確定π介子標量形狀因子及相關半徑。計算結果基於17組Nf=2+1 威爾遜Clover 改進海夸克的規範系綜，這些系綜覆蓋了0.049-0.086fm四種晶格間距、130-350MeV的π介子質量範圍以及多種物理體積。通過對著名的夸克斷開貢獻的精確測定，我們首次在接近物理夸克質量的大尺寸精細系綜上實現了形狀因子前所未有的動量分辨率。採用1.0-3.25fm寬範圍的源匯分離距離，可靠地提取了零動量轉移和非零動量轉移下的基態矩陣元。這使得我們首次能通過所得形狀因子 Q²依賴性的z展開參數化（而非小動量轉移下的簡單線性近似）來獲取標量半徑。使用三味NLO 手征微擾理論對半徑進行物理外推，以三個低能常數（包括首次格點測定的L₄ʳ）參數化夸克質量依賴性。通過基於赤池信息準則的模型平均，我們量化了基態提取、形狀因子參數化以及物理外推等環節對最終結果的系統不確定性。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數最大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：我們研究一維高斯位置混合模型的非參數極大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定包含$n$個數據點的數據集，該估計量總是返回最多包含$n$個分量的混合模型，而近期(Wu-Polyanskiy, 2020)對亞高斯數據給出了尖銳的$O(\log n)$界。本文重點研究$\widehat{\pi}$的計算特性：我們提出一種算法，當$\varepsilon>0$足夠小時，可在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算出Wasserstein距離意義下的$\varepsilon$-近似解$\widehat\pi$。其中$K$與數據相關但與$\varepsilon$無關，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子數量。我們還可在有限時間內確定性計算出$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$中的點獨立採樣自具有（相對於勒貝格測度的）密度函數的概率分布時，這些保證幾乎必然成立。我們還證明：當限定為$k$原子時，$\widehat\pi$的條件分布在相關$2k-1$維參數空間上存在密度函數（對所有$k\leq \sqrt{n}/3$成立），且EM算法幾乎必然具有局部線性收斂性。關鍵工具之一是針對非退化曲線的經典傅里葉分析估計。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子勢的聚合物電解質膜質子傳輸大規模長時原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢能（MLIPs）作為一種能夠實現大規模、長時間原子模擬的方法備受關注，同時保持與基於密度泛函理論（DFT）和從頭算波函數理論的電子結構計算相當的精度。然而，基於MLIP的分子動力學（MD）模擬面臨的挑戰是其穩定性低於使用傳統經典勢能的模擬。分析高度異質體系或非晶材料通常需要大規模和長時間的模擬，因此需要開發能夠實現穩定MD模擬的魯棒MLIPs。在本研究中，我們利用神經網絡勢能（NNP）生成器，構建了一個NNP模型，能夠在廣泛水合水平下對全氟離聚物膜（Nafion）進行大規模、長時間的MD模擬。通過主動學習循環迭代擴展數據集，我們成功建立了魯棒的深度勢能（DP）模型。具體而言，通過結合非平衡DPMD模擬採樣的非平衡結構，以及在包含最小原子間距離的3D結構特徵空間中進行結構篩選，可以顯著增強DP模型的魯棒性，從而實現對約10,000至20,000個原子的大型Nafion系統進行長達31 ns的穩定MD模擬。採用所開發DP模型的MD模擬得到的氫原子自擴散係數，在廣泛水合水平範圍內與實驗值更為接近，優於先前對小體系進行的從頭算MD模擬結果。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：一個開放、快速、可靠且高效的每日任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過將地址複製到多個位置來實現降低延遲和增強韌性等目標。由於任播在現代互聯網中的關鍵作用，先前研究已開發了執行任播普查的工具。首個工具iGreedy利用地理分散位置的延遲測量來繪製任播部署圖；第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——可在3小時內完成全網普查，但存在準確性和精確性問題。相反，iGreedy準確性極高但速度較慢，且探測成本更高。本文針對這兩個系統的缺陷，提出了升級版MAnycast Reloaded（MAnycastR）。以MAnycast2為基礎，我們徹底重構了其測量管道，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持以及類似iGreedy的延遲測量功能。我們在含32個全球分布式節點的任播測試平台上驗證MAnycastR，對比實際任播生產部署，並通過RIPE Atlas進行大規模延遲測量，同時將檢測到的60%以上任播前綴與運營商真實數據進行交叉驗證。結果表明MAnycastR實現了高準確性與精確度。我們將持續提供每日MAnycastR普查數據，並以寬鬆開源協議發布工具源代碼。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：基於屬性圖的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：給定圖$G$和種子節點$v_s$，局部圖聚類（LGC）的目標是在與$C_s$大小近似線性相關的時間內，識別出圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖的應用場景。然而，現有解決方案大多僅依賴圖中節點的拓撲連接性，容易受到現實圖譜中普遍存在的缺失或噪聲鏈接的影響。為解決該問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC建模為雙向擴散分布（BDD）的估計問題，該模型專門用於捕捉含屬性節點的多跳關聯性。進一步提出LACA方法——一種高效且具備嚴格理論保證的LGC方案，其核心包含：(i) 基於理論基礎的快速節點屬性預處理技術，(ii) 具有自適應擴散能力和加速收斂特性的向量傳播算法，(iii) 高效的三步式BDD近似框架。在8個真實數據集上與17種基線方法的對比實驗表明，LACA在真實局部簇的評估指標上全面優於所有對比方法，同時速度提升達數量級。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重連動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成了任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會新陳代謝系統。SCN絕非靜態存在，而是通過企業的進出和供應關係的重組不斷演變。本研究利用獨特數據集追蹤了一個國家SCN中企業及其供應商-採購商關係的時序演化。基於匈牙利2014至2022年按月申報的增值稅數據，我們重建了包含711,248家企業和38,644,400條連接的整體經濟網絡，實現了企業級分辨率下完整經濟體系的重構事件全覆蓋。研究發現：每年約25%的企業退出SCN，同時28%的新企業進入；平均55%的現存供應鏈接會在次年消失；供應鏈接的半衰期為13個月。新鏈接以超偏好依附概率$p(i)\propto k_i^{1.08}$（$k_i$表示企業i的供應連接數）附着於企業。我們校準的簡易統計網絡生成模型成功復現了匈牙利主導SCN的典型特徵，不僅能重現入/出度分布、同配性和聚類結構等局部網絡特徵，還可捕捉真實的系統性風險輪廓。該模型揭示了經濟重連動態對量化系統韌性和評估衝擊傳導的關鍵作用。

摘要

原文標題：Ion beam treatment of thick polystyrene films
中文標題：厚聚苯乙烯薄膜的離子束處理
發布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分類：physics.chem-ph
原文鏈接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋塗厚度為78 nm至1.3 μm的聚苯乙烯薄膜經20 keV氮離子束處理後，橢偏儀測量和傅里葉變換紅外光譜顯示表面改性層深度與離子在聚合物中的穿透深度（約70 nm）相符。然而，深層洗滌及後續測試表明，薄改性層中形成的自由基會遷移至本體層，導致深層聚苯乙烯發生一系列化學結構變化。因此，儘管離子在聚苯乙烯薄膜中的穿透深度較淺，但整個薄膜的改性深度遠超過離子投影射程。這表明離子束處理僅能條件性地視為表面改性方法，必須考慮自由基反應及其向聚合物深層遷移的可能性。

摘要

原文標題：The Scalar Size of the Pion from Lattice QCD
中文標題：格點QCD中π介子的標量大小
發布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分類：hep-lat, hep-ph
原文鏈接：http://arxiv.org/abs/2503.20687v1

中文摘要：我們提出了一種系統誤差完全受控的格點QCD計算，用於確定π介子標量形狀因子及相關半徑。計算結果基於17個規範系綜的大規模數據集，這些系綜採用$N_f=2+1$威爾遜Clover改進的海夸克配置。這些系綜覆蓋了從$a=0.049\mathrm{fm}$到$a=0.086\mathrm{fm}$四種格點間距，π介子質量範圍為$130-350\mathrm{MeV}$以及多種物理體積。通過對著名的夸克斷開貢獻的精確測定，我們首次在物理夸克質量附近的大尺度精細系綜上實現了形狀因子前所未有的動量分辨率。採用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$範圍內多種源-匯間距，可靠地提取了零動量轉移和非零動量轉移下的基態矩陣元。這使得我們能夠首次通過所得形狀因子$Q^2$依賴性的$z$展開參數化（而非小動量轉移下的簡單線性近似）來獲取標量半徑。半徑的物理外推採用三味NLO手征微擾理論，通過三個低能常數（包括$L_4^r$的首次格點測定）來參數化夸克質量依賴性。基於赤池信息準則的模型平均方法，我們對基態提取、形狀因子參數化以及物理外推等環節產生的系統誤差進行了量化處理。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數極大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：我們研究一維高斯位置混合模型的非參數極大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定n個數據點時該估計量總是返回最多含n個分量的混合模型，而近期(Wu-Polyanskiy, 2020)對亞高斯數據給出了嚴格的$O(\log n)$界。本文研究$\widehat{\pi}$的計算特性：我們提出一種算法，當$\varepsilon>0$足夠小時，可在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算Wasserstein距離下的$\varepsilon$近似解，其中$K$依賴數據但與$\varepsilon$無關，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$是$\widehat\pi$的原子數。我們還可在有限時間內確定性計算$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$來自具有密度（相對於Lebesgue測度）的概率分布時，這些保證幾乎必然成立。我們還證明：當$k\leq \sqrt{n}/3$時，限定為k原子的$\widehat\pi$條件分布在相關$2k-1$維參數空間上存在密度，且EM算法幾乎必然具有局部線性收斂性。關鍵工具之一是非退化曲線的經典傅里葉分析估計。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子勢的大規模長時質子交換膜質子傳輸原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢（MLIPs）作為一種能夠實現大規模、長時間原子模擬的方法備受關注，同時保持與基於密度泛函理論（DFT）和從頭算波函數理論的電子結構計算相當的精度。然而，基於MLIP的分子動力學（MD）模擬面臨的挑戰是其穩定性低於使用傳統經典勢的模擬。分析高度異質體系或非晶材料通常需要大規模和長時間的模擬，因此需要開發能夠實現穩定MD模擬的魯棒MLIP。在本研究中，我們利用神經網絡勢（NNP）生成器，構建了一個NNP模型，能夠在廣泛水合水平下對全氟離聚物膜（Nafion）進行大規模、長時間的MD模擬。通過主動學習循環迭代擴展數據集，我們成功建立了魯棒的深度勢（DP）模型。具體而言，通過將非平衡DPMD模擬採樣的非平衡結構與結合最小原子間距的三維結構特徵空間中的結構篩選相結合，可以顯著增強DP模型的魯棒性，從而實現對約10,000至20,000個原子的大型Nafion系統進行長達31 ns的穩定MD模擬。採用所開發DP模型的MD模擬得到的氫原子自擴散係數，在廣泛水合水平範圍內與實驗值更為接近，優於先前對小體系進行的從頭算MD模擬結果。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：開放、快速、可靠且高效的每日任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過將地址複製到多個位置來實現（例如）降低延遲和增強韌性。由於任播在現代互聯網中的關鍵作用，先前研究已開發了執行任播普查的工具。首個工具iGreedy利用地理分散位置的延遲測量來映射任播部署；第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——能在3小時內完成全網普查，但存在準確性和精確性問題。相反，iGreedy精度極高但速度較慢，且探測成本更高。本文針對這兩個系統的缺陷，提出了MAnycast Reloaded（MAnycastR）。我們以MAnycast2為基礎，徹底重構其測量流程，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持，以及類似iGreedy的延遲測量功能。通過在含32個全球分布式節點的任播測試床上驗證，與外部任播生產部署對比，結合RIPE Atlas的廣泛延遲測量，並對檢測到的任播前綴中超過60%進行運營商真實數據交叉核驗，證明MAnycastR具備高準確性與精確性。我們將持續提供每日MAnycastR普查數據，並以寬鬆開源協議發布工具源代碼。

摘要

原文標題：Flow of a two-dimensional liquid foam: Impact of surfactant type and boundary conditions
中文標題：二維液體泡沫的流動：表面活性劑類型和邊界條件的影響
發布日期：2025-03-26 16:44:40+00:00
作者：Farshad Nazari, Andrei Potanin, Hadi Mohammadigoushki
分類：cond-mat.soft, physics.flu-dyn
原文鏈接：http://arxiv.org/abs/2503.20710v1

中文摘要：本研究通過實驗探究了二維單分散水性泡沫在平行板間剪切時的流變與流動行為，採用自製配備光滑/粗糙壁面的流變光學裝置。使用兩種市售洗滌劑（Foam 1與Foam 2）製備泡沫，保持氣泡尺寸與液相分數相近。線性粘彈性結果表明：無論邊界條件如何，Foam 1始終表現出比Foam 2更高的彈性模量與損耗模量，且粗糙壁面會進一步強化兩種泡沫的模量。此外，Foam 1的粘彈性弛豫頻率更低，表明其界面遷移性較弱。在非線性區域觀察到顯著差異：光滑邊界條件下，Foam 2呈現屈服應力行為而Foam 1未出現，儘管後者具有更高粘性應力。Foam 1的粘性應力與毛細數呈標度關係，而Foam 2的標度行為依邊界條件（光滑/粗糙壁面）呈現差異。這些流變行為差異源於表面活性劑化學性質不同導致的界面遷移性差異，Foam 1的界面遷移性相對Foam 2更弱。

摘要

原文標題：Search for events with one displaced vertex from long-lived neutral particles decaying into hadronic jets in the ATLAS muon spectrometer in $pp$ collisions at $\sqrt{s}=13$ TeV
中文標題：在$\sqrt{s}=13$ TeV的$pp$對撞中ATLASμ子譜儀內長壽命中性粒子衰變為強子噴注產生單位移頂點的事例搜尋
發布日期：2025-03-26 11:21:36+00:00
作者：ATLAS Collaboration
分類：hep-ex
原文鏈接：http://arxiv.org/abs/2503.20445v1

中文摘要：摘要：本文報道了利用大型強子對撞機 ATLAS探測器在2015-2018年收集的$\sqrt{s}=13$ TeV質子-質子對撞數據（積分亮度140 fb$^{-1}$），對長壽命中性粒子衰變為強子噴注產生單位移頂點事件的搜尋。該研究採用特殊重建技術，針對μ子譜儀中距主相互作用頂點3-14米處衰變的長壽命粒子頂點進行重建。觀測事件數與預期本底相符，並對多個基準信號模型設定了限制。研究考慮了標量門戶模型和希格斯玻色子門戶重子生成模型，並專門設計了分析通道來研究Z玻色子伴隨的長壽命粒子產生（包括類軸子粒子和暗光子模型）。對於希格斯玻色子模型，在95%置信水平下排除了長壽命粒子固有衰變長度在5厘米至40米範圍內分支比高於1%的情況。針對所研究的避光類軸子粒子模型，本次搜尋對固有衰變長度大於$\mathcal{O}(10)$厘米的情況給出了迄今最強的限制。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：基於屬性圖的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：給定圖$G$和種子節點$v_s$，局部圖聚類（LGC）的目標是在與$C_s$大小大致成線性關係的時間內，識別出圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖的應用場景。然而，現有解決方案大多僅依賴圖中節點的拓撲連接性，容易受到現實圖數據中普遍存在的缺失或噪聲鏈接的影響。為解決該問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC建模為雙向擴散分布（BDD）的估計問題，該模型專門用於捕捉含屬性節點的多跳關聯性。進一步提出LACA方法——一種高效且具備強局部性的LGC解決方案，在多個真實數據集上表現出卓越性能。其核心組件包括：（i）基於理論基礎的快速節點屬性預處理技術；（ii）具有嚴格理論保證和加速收斂特性的自適應向量擴散算法；（iii）BDD近似計算的有效三步方案。在8個真實數據集上與17種對比方法的實驗表明，LACA在真實局部簇的衡量標準下結果質量最優，同時速度可提升數個數量級。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重構動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成了任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會新陳代謝系統。SCN絕非靜態存在，而是通過企業的進出與供應關係的重組持續演變。本研究利用獨特數據集追蹤了一個國家SCN中企業及其供應商-客戶關係的時間演化。基於匈牙利2014至2022年每月報告的增值稅數據，我們重建了包含711,248家企業和38,644,400條連接的完整經濟網絡，實現了企業級分辨率下整個經濟體重組事件的完整記錄。研究發現：每年約25%的企業退出SCN，同時28%的新企業加入；平均55%的現存供應鏈接會在次年消失；供應鏈接的半衰期為13個月。新鏈接以超偏好依附概率$p(i)\propto k_i^{1.08}$（$k_i$表示企業i的供應連接數）與企業建立關聯。我們校準了一個能復現匈牙利主導SCN典型特徵的簡易統計網絡生成模型，該模型不僅重現了入/出度分布、同配性和聚類結構等局部網絡特徵，還捕捉到真實的系統性風險輪廓。最後探討了經濟重連動態對量化系統韌性和估計衝擊傳導的關鍵作用。

摘要

原文標題：Ion beam treatment of thick polystyrene films
中文標題：厚聚苯乙烯薄膜的離子束處理
發布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分類：physics.chem-ph
原文鏈接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋塗厚度為78納米至1.3微米的不同厚度聚苯乙烯薄膜，並用能量為20 keV的氮離子進行處理。橢圓偏振測量和傅里葉變換紅外光譜顯示，表面層的改性對應於離子在聚合物中的穿透深度（約70納米）。然而，對深層進行清洗和後續測量表明，在薄改性層中形成的自由基遷移到體層中，並引起深層聚苯乙烯化學結構的諸多變化。因此，儘管離子在聚苯乙烯薄膜中的穿透深度較小，但整個薄膜的改性深度遠大於離子的投影射程。因此，離子束處理聚合物僅在特定條件下是一種表面改性方法。必須考慮自由基反應及其向聚合物深層遷移的可能性。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：開放、快速、可靠且高效的每日任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過將地址複製到多個位置來實現降低延遲和增強韌性等目標。由於任播在現代互聯網中的關鍵作用，先前研究已開發了執行任播普查的工具。首個工具iGreedy利用地理分散位置的延遲測量來繪製任播部署圖；第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——可在3小時內完成全網普查，但存在準確性和精確性問題。反之，iGreedy精度極高但速度較慢，且探測成本更高。本文針對這兩個系統的缺陷，提出了MAnycast Reloaded（MAnycastR）。我們以MAnycast2為基礎，徹底重構其測量流水線，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持以及類似iGreedy的延遲測量功能。通過在含32個全球分布式節點的任播測試床上驗證，與外部任播生產部署對比，結合RIPE Atlas的廣泛延遲測量，並對檢測到的60%以上任播前綴進行運營商數據交叉核驗，證明MAnycastR具備高準確性與精確性。我們將持續提供每日MAnycastR普查數據，並以寬鬆開源協議發布工具源代碼。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數極大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：我們研究一維高斯位置混合模型的非參數最大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定n個數據點時該估計量總是返回最多含n個分量的混合模型，而近期(Wu-Polyanskiy, 2020)對亞高斯數據給出了嚴格的$O(\log n)$界。本文研究$\widehat{\pi}$的計算特性：我們提出一種算法，當$\varepsilon>0$足夠小時，可在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算出Wasserstein距離意義上的$\varepsilon$近似解，其中$K$與數據相關但與$\varepsilon$無關，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子數量。我們還可在有限時間內確定性計算$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有密度函數（相對於勒貝格測度）的概率分布獨立採樣生成時，這些保證幾乎必然成立。我們還證明：當$k\leq \sqrt{n}/3$時，限定為k原子結構的$\widehat\pi$條件分布在相關$2k-1$維參數空間上存在密度函數，且EM算法幾乎必然具有局部線性收斂性。其中關鍵工具是針對非退化曲線的經典傅里葉分析估計。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子勢的大規模長時質子交換膜質子傳輸原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢（MLIPs）作為一種能夠實現大規模、長時間原子模擬並保持與基於密度泛函理論（DFT）和從頭算波函數理論的電子結構計算相當精度的方法，引起了廣泛關注。然而，基於MLIP的分子動力學（MD）模擬面臨的挑戰是其穩定性低於傳統經典勢函數。分析高度異質體系或非晶材料通常需要大規模長時間模擬，這要求開發能夠實現穩定MD模擬的魯棒性MLIP。本研究利用我們的神經網絡勢（NNP）生成器，構建了一個NNP模型，可在廣泛水合水平範圍內對全氟離聚物膜（Nafion）進行大規模長時間MD模擬。通過主動學習循環迭代擴展數據集，我們成功建立了魯棒的深度勢（DP）模型。具體而言，通過將非平衡DPMD模擬採樣的非平衡結構與結合最小原子間距的三維結構特徵空間篩選相結合，可顯著提升DP模型的魯棒性，從而實現對約10,000至20,000原子的大型Nafion體系進行長達31 ns的穩定MD模擬。採用所開發DP模型的MD模擬獲得的氫原子自擴散係數，在廣泛水合水平範圍內比先前小體系從頭算MD模擬結果更接近實驗值。

摘要

原文標題：Flow of a two-dimensional liquid foam: Impact of surfactant type and boundary conditions
中文標題：二維液體泡沫的流動：表面活性劑類型與邊界條件的影響
發布日期：2025-03-26 16:44:40+00:00
作者：Farshad Nazari, Andrei Potanin, Hadi Mohammadigoushki
分類：cond-mat.soft, physics.flu-dyn
原文鏈接：http://arxiv.org/abs/2503.20710v1

中文摘要：本研究通過實驗探究了二維單分散水性泡沫在平行板間剪切時的流變與流動行為，採用自製光流變儀（配備光滑/粗糙壁面）完成測試。使用兩種市售洗滌劑（Foam 1和Foam 2）製備泡沫，並保持氣泡尺寸和液相分數一致。線性粘彈性結果表明：無論邊界條件如何，Foam 1始終表現出比Foam 2更高的彈性模量和損耗模量，且粗糙壁面會進一步強化兩種泡沫的模量。此外，Foam 1的粘彈性弛豫頻率更低，表明其界面流動性較弱。非線性區域則呈現顯著差異：在光滑邊界條件下，Foam 2表現出屈服應力行為而Foam 1未出現，儘管後者具有更高的粘性應力。Foam 1的粘性應力與毛細數呈標度關係，而Foam 2的標度行為則因光滑/粗糙壁面呈現不同模式。這些流變學差異源於表面活性劑化學性質導致的界面流動性差異，其中Foam 1的界面流動性低於Foam 2。

摘要

原文標題：Search for events with one displaced vertex from long-lived neutral particles decaying into hadronic jets in the ATLAS muon spectrometer in $pp$ collisions at $\sqrt{s}=13$ TeV
中文標題：在$\sqrt{s}=13$ TeV的$pp$對撞中ATLASμ子譜儀內長壽命中性粒子衰變為強子噴注產生單位移頂點的事例搜尋
發布日期：2025-03-26 11:21:36+00:00
作者：ATLAS Collaboration
分類：hep-ex
原文鏈接：http://arxiv.org/abs/2503.20445v1

中文摘要：摘要：本文報道了利用ATLAS探測器在大型強子對撞機上收集的數據（2015-2018年記錄的$\sqrt{s}=13$ TeV質子-質子對撞數據，積分亮度140 fb$^{-1}$）對長壽命中性粒子衰變為強子噴注產生單位移頂點事件的搜尋。該研究採用頂點重建技術，針對μ子譜儀中距初級相互作用頂點3-14米處衰變的長壽命粒子。觀測事件數與預期本底相符，並確定了若干基準信號模型的限制。研究考慮了標量門戶模型和希格斯玻色子門戶重子生成模型，同時設立專門分析通道針對Z玻色子伴隨的長壽命粒子產生（包括類軸子粒子和暗光子模型）。對於希格斯玻色子模型，在95%置信水平下排除了長壽命粒子固有衰變長度5厘米至40米範圍內分支比高於1%的情況；對於所研究的避光類軸子粒子模型，本次搜尋對固有衰變長度大於$\mathcal{O}(10)$厘米的情況給出了迄今最強的限制。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：基於屬性圖的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：給定圖$G$和種子節點$v_s$，局部圖聚類（LGC）的目標是在與$C_s$大小大致成線性關係的時間內，識別出圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖的應用場景。然而現有方案大多僅依賴圖中節點的拓撲連接性，容易受到現實圖譜中普遍存在的缺失鏈接或噪聲鏈接的影響。為解決該問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC建模為雙向擴散分布（BDD）的估計問題，該模型專門用於捕捉帶屬性節點的多跳關聯性。進一步提出LACA方法——一種高效且具備嚴格理論保證的LGC方案，其核心組件包括：(i) 快速且理論完備的節點屬性預處理技術；(ii) 具有理論收斂保證的自適應向量擴散算法；(iii) 高效的三步式BDD近似方案。在8個真實數據集上與17種對比方法的實驗表明，LACA在真實局部簇的衡量標準下全面優於所有對比方法，同時速度提升達數量級。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：Ion beam treatment of thick polystyrene films
中文標題：厚聚苯乙烯薄膜的離子束處理
發布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分類：physics.chem-ph
原文鏈接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋塗厚度從78納米至1.3微米不等的聚苯乙烯薄膜，經20 keV氮離子束處理後，橢圓偏振測量和傅里葉變換紅外光譜顯示表面改性層深度與離子在聚合物中的穿透深度（約70納米）相符。然而，深層洗滌及後續測試表明，薄改性層中形成的自由基會遷移至本體層，導致深層聚苯乙烯的化學結構發生系列變化。因此，儘管離子在聚苯乙烯膜中的穿透深度有限，整個薄膜的改性深度卻遠超過離子投影射程。這表明離子束處理僅能有條件地視為表面改性方法，必須考慮自由基反應及其向聚合物深層遷移的可能性。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：一個開放、快速、可靠且高效的每日任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過將地址複製到多個位置來實現（例如）降低延遲和增強韌性。由於任播在現代互聯網中的關鍵作用，先前研究已開發了執行任播普查的工具。首個工具iGreedy利用地理分散位置的延遲測量來繪製任播部署圖；第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——可在3小時內完成全網普查，但存在準確性和精確性問題。相反，iGreedy精度極高但速度較慢，且探測成本更高。本文針對這兩個系統的缺陷提出了MAnycast Reloaded（MAnycastR）。以MAnycast2為基礎，我們徹底重構了其測量流水線，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持以及類似iGreedy的延遲測量功能。我們在含32個全球分布式節點的任播測試平台上驗證MAnycastR，對比實際任播生產部署，並通過RIPE Atlas進行廣泛延遲測量，同時將檢測到的60%以上任播前綴與運營商真實數據交叉核驗。結果表明MAnycastR實現了高準確性與精確度。我們將持續提供每日MAnycastR普查數據，並以寬鬆開源協議發布工具源代碼。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重構動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會代謝系統。供應鏈網絡絕非靜態，而是通過企業的進出和供應關係的重組不斷變化。本研究利用獨特數據集探究了一個國家供應鏈網絡中企業及其供應商-客戶關係的時間演化。基於匈牙利2014至2022年按月申報的增值稅數據，我們重建了包含711,248家企業和38,644,400條連接關係的完整經濟網絡，以企業級分辨率覆蓋了整個經濟體的幾乎每次重構事件。研究發現：每年約25%的企業退出供應鏈網絡，同時28%的新企業加入；平均55%的現存供應鏈接會在次年消失；供應鏈接的半衰期為13個月。新鏈接以超偏好依附概率$p(i)\propto k_i^{1.08}$連接企業（$k_i$表示企業$i$的供應連接數）。我們校準了一個能復現匈牙利主導供應鏈網絡典型特徵的簡單統計網絡生成模型，該模型不僅復現了入/出度分布、同配性和聚類結構等局部網絡特徵，還捕捉了真實的系統性風險特徵。最後討論了當前模型如何通過經濟重連動態來量化系統韌性和估計衝擊傳導。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數最大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：摘要：我們研究一維高斯位置混合的非參數極大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定n個數據點時該估計量始終返回最多含n個分量的混合模型，而近期(Wu-Polyanskiy, 2020)對次高斯數據給出了嚴格的$O(\log n)$界。本文研究$\widehat{\pi}$的計算特性：提出一種算法，當$\varepsilon>0$足夠小時，可在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算Wasserstein距離下的$\varepsilon$近似解，其中$K$與數據相關但與$\varepsilon$無關，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$為$\widehat\pi$的原子數。我們還可在有限時間內確定性計算$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有密度（相對於Lebesgue測度）的概率分布獨立生成時，這些保證幾乎必然成立。我們還證明：當$k\leq \sqrt{n}/3$時，限定為k原子分布的$\widehat\pi$在其$2k-1$維參數空間上具有密度，且EM算法幾乎必然局部線性收斂。關鍵工具之一是非退化曲線的經典傅里葉分析估計。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子勢的大規模長時質子交換膜質子傳輸原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢能（MLIPs）作為一種能夠實現大規模、長時間原子尺度模擬的方法備受關注，同時保持與基於密度泛函理論（DFT）和從頭算波函數理論的電子結構計算相當的精度。然而，基於MLIP的分子動力學（MD）模擬面臨的挑戰是其穩定性低於使用傳統經典勢能的模擬。分析高度異質體系或非晶材料通常需要大規模和長時間的模擬，因此需要開發能夠進行穩定MD模擬的魯棒MLIPs。在本研究中，我們利用神經網絡勢能（NNP）生成器，構建了一個NNP模型，能夠在廣泛水合水平下對全氟磺酸離聚物膜（Nafion）進行大規模、長時間的MD模擬。通過主動學習循環迭代擴展數據集，我們成功構建了魯棒的深度勢能（DP）模型。具體而言，通過結合非平衡DPMD模擬對非平衡結構的採樣與在包含最小原子間距離的3D結構特徵空間中的結構篩選，可以顯著增強DP模型的魯棒性，這使得能夠對大約10,000至20,000個原子的大型Nafion體系進行長達31 ns的穩定MD模擬。採用所開發DP模型的MD模擬得到的氫原子自擴散係數，在廣泛的水合水平範圍內，與先前較小體系的從頭算MD模擬相比，更接近實驗值。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：基於屬性圖的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：給定圖$G$和種子節點$v_s$，局部圖聚類(LGC)的目標是在與$C_s$大小大致成線性關係的時間內，識別出圍繞$v_s$的子圖$C_s \in G$(即局部簇)。這種方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖的應用場景。然而，現有解決方案大多僅依賴圖中節點的拓撲連接性，容易受到現實圖數據中普遍存在的缺失鏈接或噪聲鏈接的影響。為解決這一問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC建模為雙向擴散分布(BDD)的估計問題，該模型專門用於捕捉帶屬性節點的多跳關聯性。進一步提出LACA方法——一種高效且具備強局部性的LGC解決方案，在多個真實數據集上表現出卓越性能。LACA的核心組件包括：(i)基於理論基礎的快速節點屬性預處理技術；(ii)具有嚴格理論保證和加速收斂特性的自適應向量擴散算法；(iii)有效的BDD近似三步驟方案。通過在8個真實數據集上與17種對比方法的實驗表明，LACA在真實局部簇的評估指標上全面優於所有對比方法，同時實現數量級的速度提升。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：開放、快速、可靠且高效的每日任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過將地址複製到多個位置來實現，例如降低延遲和增強彈性。由於任播在現代互聯網中的關鍵作用，先前研究引入了執行任播普查的工具。首個工具iGreedy利用地理分散位置的延遲測量來映射任播部署；第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——可在3小時內完成全網普查，但存在準確性和精確性問題。相反，iGreedy精度極高但速度較慢，且探測成本更高。本文針對這兩個系統的缺陷，提出了MAnycast Reloaded（MAnycastR）。以MAnycast2為基礎，我們徹底重構了其測量流水線，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持，以及類似iGreedy的延遲測量功能。我們在含32個全球分布式節點的任播測試平台上驗證MAnycastR，對比外部任播生產部署，通過RIPE Atlas進行廣泛延遲測量，並將檢測到的60%以上任播前綴與運營商真實數據交叉核驗。結果表明MAnycastR實現了高準確性和精確性。我們以寬鬆開源協議向社區提供每日持續的MAnycastR普查數據，並公開工具源代碼。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重構動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成了任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會新陳代謝系統。SCN絕非靜態存在，而是通過企業的進出和供應關係的重組持續演變。本研究利用獨特數據集追蹤了一個國家SCN中企業及其供應商-客戶關係的時間演化。基於匈牙利2014至2022年每月報告的增值稅數據，我們重建了包含711,248家企業和38,644,400條連接的完整經濟網絡，以企業級分辨率捕捉了整個經濟體的每次重構事件。研究發現：每年約25%的企業退出SCN，同時28%的新企業加入；平均55%的現存供應鏈接會在次年消失；供應鏈接的半衰期為13個月。新鏈接以超偏好方式依附企業，概率滿足$p(i)\propto k_i^{1.08}$（$k_i$表示企業i的供應連接數）。我們校準了一個能復現匈牙利主導SCN典型特徵的簡易統計網絡生成模型，該模型不僅再現了入/出度分布、同配性和聚類結構等局部網絡特徵，還捕捉了真實的系統性風險輪廓。最後探討了經濟重連動態對量化系統韌性和估計衝擊傳導的關鍵作用。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數極大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：我們研究一維高斯位置混合的非參數最大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定一個$n$點數據集，該估計量總是返回最多包含$n$個分量的混合分布，而最近(Wu-Polyanskiy, 2020)對亞高斯數據給出了嚴格的$O(\log n)$界。本文研究$\widehat{\pi}$的計算特性：我們提出一種算法，當$\varepsilon>0$足夠小時，可在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算出Wasserstein距離意義上的$\varepsilon$近似解$\widehat\pi$。其中$K$與數據相關但與$\varepsilon$無關，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子數量。我們還可在有限時間內確定性計算出$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有密度（相對於Lebesgue測度）的概率分布獨立採樣時，這些保證幾乎必然成立。我們還證明：當$\widehat\pi$被約束為$k$原子分布時，其在相關$2k-1$維參數空間上存在密度（對所有$k\leq \sqrt{n}/3$成立），且EM算法幾乎必然具有局部線性收斂性。關鍵工具之一是對非退化曲線的經典傅里葉分析估計。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子勢的聚合物電解質膜質子傳輸大規模長時間原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢（MLIPs）作為一種能夠實現大規模、長時間原子尺度模擬的方法，同時保持與基於密度泛函理論（DFT）和第一性原理波函數理論的電子結構計算相當的精度，引起了廣泛關注。然而，基於MLIP的分子動力學（MD）模擬面臨的挑戰是其穩定性低於使用傳統經典勢的模擬。分析高度異質體系或非晶材料通常需要大規模和長時間的模擬，因此需要開發能夠實現穩定MD模擬的魯棒MLIPs。在本研究中，我們利用神經網絡勢（NNP）生成器，構建了一個NNP模型，能夠在廣泛水合水平範圍內對全氟離聚物膜（Nafion）進行大規模、長時間的MD模擬。通過主動學習循環迭代擴展數據集，我們成功建立了魯棒的深度勢（DP）模型。具體而言，通過將非平衡DPMD模擬採樣的非平衡結構與結合最小原子間距的三維結構特徵空間中的結構篩選相結合，可以顯著增強DP模型的魯棒性，從而實現對約10,000至20,000個原子的大型Nafion體系進行長達31 ns的穩定MD模擬。採用所開發DP模型的MD模擬得到的氫原子自擴散係數，在廣泛水合水平範圍內與實驗值更為吻合，優於先前對小體系進行的第一性原理 MD模擬結果。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：基於屬性圖的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：給定圖$G$和種子節點$v_s$，局部圖聚類（LGC）的目標是在與$C_s$大小近似線性相關的時間內，識別出圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖的應用場景。然而，現有解決方案大多僅依賴圖中節點的拓撲連接性，容易受到現實圖數據中普遍存在的缺失或噪聲鏈接的影響。為解決該問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC建模為雙向擴散分布（BDD）的估計問題，該模型專門用於捕捉含屬性節點的多跳關聯性。進一步提出LACA方法——一種高效且具備嚴格理論保證的LGC解決方案：其核心包括（i）基於理論基礎的快速節點屬性預處理技術；（ii）具備加速收斂特性的自適應圖向量擴散算法；（iii）BDD近似計算的三步優化方案。在8個真實數據集上與17種對比方法的實驗表明，LACA在真實局部簇的評估指標上全面超越現有方法，同時實現數量級的速度提升。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：一個開放、快速、可靠且高效的每日任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過在多位置複製地址來實現降低延遲和增強韌性等目標。由於任播在現代互聯網中的關鍵作用，先前研究已開發了執行任播普查的工具。首個工具iGreedy利用地理分散位置的延遲測量來繪製任播部署圖；第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度，可在3小時內完成全網普查，但存在準確性和精確度問題。相反，iGreedy精度極高但速度較慢，且探測成本更高。本文針對這兩個系統的缺陷提出了MAnycast Reloaded（MAnycastR）。以MAnycast2為基礎，我們徹底重新設計了其測量流程，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持以及類似iGreedy的延遲測量功能。我們在含32個全球分布式節點的任播測試平台上驗證MAnycastR，與外部任播生產部署進行對比，並通過RIPE Atlas進行廣泛延遲測量，同時將檢測到的60%以上任播前綴與運營商真實數據交叉核驗。結果表明MAnycastR實現了高準確性和精確度。我們將持續提供每日MAnycastR普查數據，並以寬鬆開源協議發布該工具的源代碼。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重連動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成了任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會代謝系統。SCN絕非靜態存在，而是通過企業的進出與供應關係的重組持續演變。本研究利用獨特數據集追蹤了一個國家SCN中企業及其供需關係的時序演化。基於匈牙利2014至2022年按月申報的增值稅數據，我們重建了包含711,248家企業和38,644,400條連接的整體經濟網絡，以企業級分辨率覆蓋了近乎所有經濟重構事件。研究發現：每年約25%的企業退出SCN，同時28%的新企業加入；平均55%的年度供應關係會在次年消失；供應關係的半衰期為13個月。新連接以超偏好依附方式鏈接企業，概率滿足$p(i)\propto k_i^{1.08}$（$k_i$表示企業$i$的連接數）。我們校準的簡易統計網絡生成模型成功復現了匈牙利主導SCN的特徵模式，不僅匹配入/出度分布、同配性和聚類結構等局部特徵，還能捕捉真實的系統性風險輪廓。該模型揭示了經濟重連動態對量化系統韌性和評估衝擊傳導的關鍵作用。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數極大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：我們研究一維高斯位置混合的非參數極大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定n個數據點時該估計量總是返回最多含n個分量的混合分布，而近期(Wu-Polyanskiy, 2020)對亞高斯數據給出了精確的$O(\log n)$界。本文研究$\widehat{\pi}$的計算特性：提出一種算法，當$\varepsilon>0$足夠小時，可在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算得到Wasserstein距離意義上的$\varepsilon$近似解，其中$K$依賴數據但獨立於$\varepsilon$，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子數。我們還可在有限時間內確定性計算$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$來自具有Lebesgue測度密度的概率分布時，這些保證幾乎必然成立。同時證明：當$k\leq \sqrt{n}/3$時，限定為k原子分布的$\widehat\pi$在其$2k-1$維參數空間上存在密度，且EM算法幾乎必然具有局部線性收斂性。關鍵工具之一是對非退化曲線的經典傅里葉分析估計。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子勢的聚合物電解質膜質子傳輸大規模長時原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢（MLIPs）作為一種能夠實現大規模、長時間原子尺度模擬的方法備受關注，同時保持與基於密度泛函理論（DFT）和從頭算波函數理論的電子結構計算相當的精度。然而，基於MLIP的分子動力學（MD）模擬面臨的一個挑戰是，與傳統經典勢相比其穩定性較低。分析高度異質體系或非晶材料通常需要大規模和長時間的模擬，因此有必要開發能夠實現穩定MD模擬的魯棒性MLIP。在本研究中，我們利用自研的神經網絡勢（NNP）生成器，構建了一個NNP模型，能夠對全氟離聚物膜（Nafion）在不同水合水平下進行大規模、長時間的MD模擬。通過主動學習循環迭代擴展數據集，我們成功建立了魯棒的深度勢（DP）模型。具體而言，通過將非平衡DPMD模擬採樣的非平衡結構與結合最小原子間距的三維結構特徵空間中的結構篩選相結合，可以顯著增強DP模型的魯棒性，從而實現對約10,000至20,000個原子的大型Nafion體系進行長達31 ns的穩定MD模擬。採用所開發DP模型的MD模擬獲得的氫原子自擴散係數，在廣泛的水合水平範圍內比先前對小體系進行的從頭算MD模擬更接近實驗值。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：基於屬性圖的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：給定屬性圖$G$和種子節點$v_s$，局部圖聚類（LGC）的目標是在與$C_s$規模大致成線性關係的時間內，識別出圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖的應用場景。然而現有方案大多僅依賴圖中節點的拓撲連接性，容易受到現實圖譜中普遍存在的缺失鏈接或噪聲鏈接的影響。為解決該問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC建模為雙向擴散分布（BDD）的估計問題，該模型專門用於捕捉含屬性節點的多跳關聯性。進一步提出LACA方法——一種高效且具備強局部性的LGC解決方案，在多個真實數據集上展現出卓越性能。其核心組件包括：(i) 基於理論基礎的快速節點屬性預處理技術；(ii) 具有嚴格理論保證和加速收斂特性的自適應向量擴散算法；(iii) 高效的三步式BDD近似方案。通過在8個真實數據集上與17種對比方法的實驗表明，LACA在真實局部簇的衡量標準下結果質量最優，同時速度可提升數個數量級。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：一個開放、快速、可靠且高效的每日任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過在多位置複製地址來實現降低延遲和增強韌性等目標。由於任播在現代互聯網中的關鍵作用，先前研究已開發了執行任播普查的工具。首個工具iGreedy利用地理分散位置的延遲測量來繪製任播部署圖；第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度，能在3小時內完成全網普查，但存在準確性和精確性問題。反之，iGreedy精度極高但速度較慢，且探測成本更高。本文針對這兩個系統的缺陷，提出了MAnycast Reloaded（MAnycastR）。以MAnycast2為基礎，我們徹底重新設計了其測量流程，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持以及類似iGreedy的延遲測量功能。我們在含32個全球分布節點的任播測試平台上驗證MAnycastR，與外部任播生產部署進行對比，並通過RIPE Atlas進行廣泛延遲測量，同時將檢測到的60%以上任播前綴與運營商真實數據交叉驗證。結果表明MAnycastR實現了高準確性和精確度。我們以寬鬆開源許可向社區提供每日持續的MAnycastR普查數據，並發布該工具的源代碼。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重構動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成了任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會新陳代謝系統。供應鏈網絡絕非靜態存在，而是通過企業的進入退出與供應關係的持續重組經歷着永久性變化。本文利用獨特數據集研究了一個國家供應鏈網絡中企業及其供應商-採購商關係的時間演化。基於匈牙利2014至2022年按月申報的增值稅數據，我們重建了包含711,248家企業和38,644,400條連接關係的完整經濟網絡，實現了企業級分辨率下整個經濟體幾乎所有重構事件的覆蓋。研究發現：每年約25%的企業退出供應鏈網絡，同時28%的新企業進入；平均而言，當年存在的供應鏈接中有55%會在次年消失；供應鏈接的半衰期為13個月。新鏈接以超偏好依附方式連接企業，概率滿足$p(i)\propto k_i^{1.08}$（$k_i$表示企業$i$的供應連接數）。我們校準了一個能復現匈牙利主導供應鏈網絡典型特徵的簡易統計網絡生成模型，該模型不僅再現了入/出度分布、同配性和聚類結構等局部網絡特徵，還捕捉到真實的系統性風險特徵。最後探討了經濟網絡重連動態對量化系統韌性和估計衝擊傳導的關鍵作用。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數最大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：我們研究一維高斯位置混合模型的非參數最大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定n個數據點時該估計量總是返回最多含n個分量的混合模型，而近期(Wu-Polyanskiy, 2020)對亞高斯數據給出了精確的$O(\log n)$界。本文研究$\widehat{\pi}$的計算特性：我們提出的算法能在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算Wasserstein距離意義上的$\varepsilon$近似解，其中$K$與$\varepsilon$無關但依賴數據，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子數量。我們還可在有限時間內確定性計算$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$來自具有密度（相對於Lebesgue測度）的概率分布時，這些保證幾乎必然成立。我們進一步證明：當$\widehat\pi$被約束為k原子分布時，其在$2k-1$維參數空間上存在密度（對所有$k\leq \sqrt{n}/3$成立），且EM算法幾乎必然具有局部線性收斂性。關鍵工具之一是針對非退化曲線的經典傅里葉分析估計。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子間勢的聚合物電解質膜質子傳輸大規模長時原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢（MLIPs）作為一種能夠實現大規模、長時間原子尺度模擬的方法，同時保持與基於密度泛函理論（DFT）和從頭算波函數理論的電子結構計算相當的精度，引起了廣泛關注。然而，基於MLIP的分子動力學（MD）模擬面臨的一個挑戰是，與傳統經典勢相比其穩定性較低。分析高度異質體系或非晶材料通常需要大規模和長時間的模擬，因此需要開發能夠實現穩定MD模擬的魯棒MLIP。在本研究中，我們利用神經網絡勢（NNP）生成器，構建了一個NNP模型，能夠在廣泛水合水平下對全氟離聚物膜（Nafion）進行大規模、長時間的MD模擬。通過主動學習循環迭代擴展數據集，我們成功建立了魯棒的深度勢（DP）模型。具體而言，通過將非平衡DPMD模擬採樣的非平衡結構與結合最小原子間距的三維結構特徵空間中的結構篩選相結合，可以顯著增強DP模型的魯棒性，從而實現對約10,000至20,000個原子的大型Nafion體系進行長達31 ns的穩定MD模擬。採用所開發DP模型的MD模擬獲得的氫原子自擴散係數，在廣泛水合水平範圍內與實驗值更為吻合，優於先前對小體系進行的從頭算MD模擬結果。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：基於屬性圖的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：給定圖$G$和種子節點$v_s$，局部圖聚類（LGC）的目標是在與$C_s$大小近似線性相關的時間內，識別出圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖的應用場景。然而現有方案大多僅依賴圖中節點的拓撲連接性，容易受到現實圖譜中普遍存在的缺失或噪聲鏈接的影響。為解決該問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC建模為雙向擴散分布（BDD）的估計問題，該模型專門用於捕捉含屬性節點間的多跳關聯。進一步提出LACA方法——一種高效且具備嚴格理論保證的LGC方案：其核心包括（i）基於理論基礎的快速節點屬性預處理技術；（ii）具備加速收斂特性的自適應圖向量擴散算法；（iii）BDD近似計算的三步優化框架。在8個真實數據集上與17種基線方法的對比實驗表明，LACA在真實局部簇的衡量標準下全面優於所有對比方法，同時實現數量級的速度提升。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：一個開放、快速、可靠且高效的每日任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過在多位置複製地址來實現降低延遲和增強韌性等目標。由於任播在現代互聯網中的關鍵作用，先前研究已開發了執行任播普查的工具。首個工具iGreedy利用地理分散位置的延遲測量來繪製任播部署圖；第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——可在3小時內完成全網普查，但存在準確性和精確性問題。相反，iGreedy精度極高但速度較慢，且探測成本更高。本文針對這兩個系統的缺陷提出了MAnycast Reloaded（MAnycastR）。以MAnycast2為基礎，我們徹底重構了其測量流程，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持以及類似iGreedy的延遲測量功能。我們在含32個全球分布式節點的任播測試平台上驗證MAnycastR，與外部任播生產部署對比，並通過RIPE Atlas進行廣泛延遲測量，同時對檢測到的60%以上任播前綴進行運營商數據交叉驗證。結果表明MAnycastR實現了高準確性與精確度。我們將持續提供每日MAnycastR普查數據，並以寬鬆開源協議發布工具源代碼。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重構動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成了任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會新陳代謝系統。供應鏈網絡絕非靜態存在，而是通過企業的進出與供應關係的重組持續演變。本研究利用獨特數據集追蹤了一個國家供應鏈網絡中企業及其供應商-客戶關係的時間演化。基於匈牙利2014至2022年按月申報的增值稅數據，我們重構了包含711,248家企業和38,644,400條連接的完整經濟網絡，以企業級分辨率捕捉了整個經濟體的幾乎每次重構事件。研究發現：每年約25%的企業退出供應鏈網絡，同時28%的新企業加入；平均55%的現存供應關係會在次年消失；供應關係的半衰期為13個月。新連接以超偏好依附概率$p(i)\propto k_i^{1.08}$（$k_i$表示企業i的供應連接數）與企業建立關聯。我們校準了一個能復現匈牙利主導供應鏈網絡典型特徵的簡易統計網絡生成模型，該模型不僅再現了入/出度分布、同配性和聚類結構等局部網絡特徵，還捕捉了真實的系統性風險輪廓。最後探討了經濟網絡重連動態對量化系統韌性和估計衝擊傳導的關鍵作用。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數極大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：我們研究一維高斯位置混合模型的非參數最大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定包含$n$個數據點的數據集，該估計量始終返回最多包含$n$個分量的混合模型，而近期(Wu-Polyanskiy, 2020)對次高斯數據給出了嚴格的$O(\log n)$界。本文重點研究$\widehat{\pi}$的計算特性：我們提出一種算法，當$\varepsilon>0$足夠小時，可在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算出Wasserstein距離意義上的$\varepsilon$近似解$\widehat\pi$。其中$K$與數據相關但與$\varepsilon$無關，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子數量。我們還可在有限時間內確定性計算出$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$中的點獨立採樣自具有（相對於勒貝格測度的）密度函數的概率分布時，這些保證幾乎必然成立。我們還證明：當$\widehat\pi$被約束為$k$原子分布時，對於所有$k\leq \sqrt{n}/3$的情況，其在相關$2k-1$維參數空間上存在密度函數，且EM算法幾乎必然具有局部線性收斂性。關鍵工具之一是對非退化曲線的經典傅里葉分析估計。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子勢的聚合物電解質膜質子傳輸大規模長時原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢（MLIPs）作為一種能夠實現大規模、長時間原子模擬的方法備受關注，同時保持與基於密度泛函理論（DFT）和從頭算波函數理論的電子結構計算相當的精度。然而，基於MLIP的分子動力學（MD）模擬面臨的一個挑戰是，與傳統經典勢相比其穩定性較低。分析高度異質體系或非晶材料通常需要大規模和長時間的模擬，因此有必要開發能夠實現穩定MD模擬的魯棒MLIPs。在本研究中，我們利用神經網絡勢（NNP）生成器，構建了一個NNP模型，該模型能夠對全氟離聚物膜（Nafion）在不同水合水平下進行大規模、長時間的MD模擬。通過主動學習循環迭代擴展數據集，我們成功建立了一個魯棒的深度勢（DP）模型。具體而言，通過將非平衡 DPMD模擬採樣的非平衡結構與結合最小原子間距離的三維結構特徵空間中的結構篩選相結合，可以顯著增強DP模型的魯棒性，從而實現對約10,000至20,000個原子的大型Nafion體系進行長達31 ns的穩定MD模擬。採用所開發DP模型的MD模擬獲得的氫原子自擴散係數，在廣泛水合水平範圍內與實驗值更為吻合，優於先前對小體系進行的從頭算MD模擬結果。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：屬性圖上的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：給定圖$G$和種子節點$v_s$，局部圖聚類（LGC）的目標是在與$C_s$大小大致成線性關係的時間內，識別出圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，因此非常適用於涉及大規模圖的應用場景。然而，現有解決方案大多僅依賴圖中節點的拓撲連接性，容易受到現實圖數據中普遍存在的缺失或噪聲鏈接的影響。為解決這一問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC建模為雙向擴散分布（BDD）的估計問題，該模型專門用於捕捉帶屬性節點的多跳關聯性。進一步提出LACA方法——一種高效且具備嚴格理論保證的LGC方案，其核心組件包括：（i）快速且理論完備的節點屬性預處理技術；（ii）具有理論收斂保證的自適應向量擴散算法；（iii）高效的三步式BDD近似框架。在8個真實數據集上與17種基線方法的對比實驗表明，LACA在真實局部簇的評估指標上全面優於所有對比方法，同時速度提升可達數量級。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：開放、快速、可靠且高效的日常任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過在多位置複製地址來實現降低延遲和增強韌性等目標。由於任播在現代互聯網中的關鍵作用，先前研究已開發了執行任播普查的工具。首個工具iGreedy利用地理分散位置的延遲測量來映射任播部署；第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——可在3小時內完成全網普查，但存在準確性和精確性問題。反之，iGreedy精度極高但速度較慢，且探測成本更高。本文針對這兩個系統的缺陷，提出了MAnycast Reloaded（MAnycastR）。以MAnycast2為基礎，我們徹底重新設計了其測量流程，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持，以及類似iGreedy的延遲測量功能。我們在含32個全球分布式節點的任播測試平台上驗證MAnycastR，與外部任播生產部署進行對比，通過RIPE Atlas進行廣泛延遲測量，並對檢測到的60%以上任播前綴進行運營商數據交叉驗證。結果表明MAnycastR實現了高準確性與精確性。我們將持續提供每日MAnycastR普查數據，並以寬鬆開源協議發布工具源代碼。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重構動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成了任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會新陳代謝系統。SCN絕非靜態存在，而是通過企業的進出與供應關係的重組持續演變。本研究利用獨特數據集追蹤了一個國家供應鏈網絡中企業及其供應商-客戶關係的時間演化。基於匈牙利2014至2022年按月申報的增值稅數據，我們重構了包含711,248家企業和38,644,400條連接的完整經濟網絡，以企業級分辨率捕捉了整個經濟體的每次重構事件。研究發現：每年約25%的企業退出SCN，同時28%的新企業加入；平均55%的現存供應鏈接會在次年消失；供應鏈接的半衰期為13個月。新鏈接以超偏好依附概率$p(i)\propto k_i^{1.08}$（$k_i$表示企業i的供應連接數）附着於企業。我們校準了一個能復現匈牙利主導SCN典型特徵的簡易統計網絡生成模型，該模型不僅再現了入/出度分布、同配性和聚類結構等局部網絡特徵，還捕捉了真實的系統性風險輪廓。最後探討了經濟重連動態對量化系統韌性和估計衝擊傳導的關鍵作用。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數最大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：我們研究一維高斯位置混合的非參數極大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定n個數據點時該估計量總是返回最多含n個分量的混合分布，而近期(Wu-Polyanskiy, 2020)對次高斯數據給出了尖銳的$O(\log n)$界。本文研究$\widehat{\pi}$的計算特性：針對足夠小的$\varepsilon>0$，我們提出一個算法可在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算Wasserstein距離意義上的$\varepsilon$近似解，其中$K$與數據相關但與$\varepsilon$無關，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子數。我們還可在有限時間內確定性計算$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有密度函數（相對於Lebesgue測度）的概率分布獨立採樣時，這些保證幾乎必然成立。我們進一步證明：當$k\leq \sqrt{n}/3$時，限定為k原子分布的$\widehat\pi$條件分布在相應$2k-1$維參數空間上存在密度函數，且EM算法幾乎必然具有局部線性收斂性。關鍵工具之一是關於非退化曲線的經典傅里葉分析估計。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子勢的聚合物電解質膜質子傳輸大規模長時原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢（MLIPs）作為一種能夠實現大規模、長時間原子尺度模擬的方法，同時保持與基於密度泛函理論（DFT）和第一性原理波函數理論的電子結構計算相當的精度，引起了廣泛關注。然而，基於MLIP的分子動力學（MD）模擬面臨的一個挑戰是，與使用傳統經典勢的模擬相比，其穩定性較低。分析高度異質體系或非晶材料通常需要大規模和長時間的模擬，因此需要開發能夠實現穩定MD模擬的魯棒MLIPs。在本研究中，我們利用神經網絡勢（NNP）生成器，構建了一個NNP模型，能夠在廣泛水合水平範圍內對全氟離聚物膜（Nafion）進行大規模、長時間的MD模擬。通過主動學習循環迭代擴展數據集，我們成功構建了一個魯棒的深度勢（DP）模型。具體而言，通過將非平衡 DPMD模擬採樣的非平衡結構與結合最小原子間距離的三維結構特徵空間中的結構篩選相結合，可以顯著增強DP模型的魯棒性，從而實現對約10,000至20,000個原子的大型Nafion體系進行長達31 ns的穩定MD模擬。採用所開發DP模型的MD模擬得到的氫原子自擴散係數，與先前較小體系的第一性原理 MD模擬相比，在廣泛水合水平範圍內更接近實驗值。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：基於屬性圖的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：給定圖$G$和種子節點$v_s$，局部圖聚類（LGC）的目標是在與$C_s$大小近似線性相關的時間內，識別出圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，因此非常適用於涉及大規模圖的應用場景。然而，現有解決方案大多僅依賴圖中節點的拓撲連接性，容易受到現實圖數據中普遍存在的缺失或噪聲鏈接的影響。為解決該問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC建模為雙向擴散分布（BDD）的估計問題，該模型專門用於捕捉帶屬性節點的多跳親和度。進一步提出LACA方法——一種高效且具備嚴格理論保證的LGC解決方案：其核心包括（i）基於理論基礎的快速節點屬性預處理技術；（ii）具備理論保證且加速收斂的自適應向量擴散算法；（iii）BDD近似計算的三步高效方案。在8個真實數據集上與17種對比方法的實驗表明，LACA在真實局部簇的衡量標準下均優於所有基線方法，同時速度提升達數量級。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：一個開放、快速、可靠且高效的每日任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過在多位置複製地址來實現降低延遲和增強韌性等目標。由於任播在現代互聯網中的關鍵作用，先前研究已開發了執行任播普查的工具。首個工具iGreedy利用地理分散位置的延遲測量來繪製任播部署圖；第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——僅需3小時即可完成全網普查，但存在準確性和精確度問題。反之，iGreedy精度極高但速度較慢，且探測成本顯著更高。本文針對這兩個系統的缺陷提出了MAnycast Reloaded（MAnycastR）。基於MAnycast2框架，我們徹底重構了其測量流程，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持以及類似iGreedy的延遲測量功能。我們在含32個全球分布式節點的任播測試平台上驗證MAnycastR，對比實際任播生產部署，並通過RIPE Atlas進行大規模延遲測量，同時對檢測到的60%以上任播前綴進行運營商數據交叉核驗。結果表明MAnycastR實現了高準確性與精確度。我們將持續提供每日MAnycastR普查數據，並以寬鬆開源協議發布工具源代碼。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：屬性圖上的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：給定圖$G$和種子節點$v_s$，局部圖聚類（LGC）的目標是在與$C_s$大小大致成線性關係的時間內，識別出圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖的應用場景。然而，現有解決方案大多僅依賴圖中節點的拓撲連接性，容易受到現實圖數據中普遍存在的缺失或噪聲鏈接的影響。為解決這一問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC建模為雙向擴散分布（BDD）的估計問題，該模型專門用於捕捉帶屬性節點的多跳關聯性。進一步提出LACA方法——一種高效且具備嚴格理論保證的LGC解決方案：其核心包括（i）基於理論基礎的快速節點屬性預處理技術；（ii）具有理論收斂保證的自適應圖向量擴散算法；（iii）高效的三步式BDD近似方案。在8個真實數據集上與17種基線方法的對比實驗表明，LACA在真實局部簇標準下的結果質量顯著優於所有對比方法，同時速度可提升數個數量級。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重連動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會代謝系統。供應鏈網絡絕非靜態存在，而是通過企業的進出與供應關係的重組持續演變。本研究利用獨特數據集追蹤了一個國家供應鏈網絡中企業及其供應商-客戶關係的時間演化。基於匈牙利2014至2022年按月申報的增值稅數據，我們重構了包含711,248家企業和38,644,400條連接的完整經濟網絡，實現了企業級分辨率下整個經濟體系重組事件的完整捕捉。研究發現：每年約25%的企業退出供應鏈網絡，同時28%的新企業進入；平均55%的現存供應鏈接會在次年消失；供應鏈接的半衰期為13個月。新鏈接以超偏好依附概率$p(i)\propto k_i^{1.08}$（$k_i$表示企業i的供應連接數）與企業建立連接。我們校準的簡易統計網絡生成模型成功復現了匈牙利主導供應鏈網絡的典型特徵，不僅能重現入/出度分布、同配性和聚類結構等局部網絡特徵，還能捕捉真實的系統性風險輪廓。最後探討了該模型如何通過經濟網絡的重連動態來量化系統韌性並評估衝擊傳導。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數最大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：我們研究一維高斯位置混合模型的非參數最大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定n個數據點時，該估計量總是返回最多含n個混合模型的分量；而近期(Wu-Polyanskiy, 2020)對次高斯數據給出了嚴格的$O(\log n)$界。本文重點研究$\widehat{\pi}$的計算特性：我們提出一種算法，當$\varepsilon>0$足夠小時，可在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算得到$\widehat\pi$的Wasserstein距離$\varepsilon$-近似解。其中$K$與數據相關但與$\varepsilon$無關，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子數量。我們還可在有限時間內確定性計算$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有密度函數（相對於勒貝格測度）的概率分布獨立採樣生成時，這些保證幾乎必然成立。我們進一步證明：當$\widehat\pi$被約束為$k$原子分布時，其條件分布在對應的$2k-1$維參數空間上存在密度函數（對所有$k\leq \sqrt{n}/3$成立），且EM算法幾乎必然具有局部線性收斂性。關鍵工具之一是對非退化曲線的經典傅里葉分析估計。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：一個開放、快速、可靠且高效的每日任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過在多位置複製地址來實現降低延遲和增強韌性等目標。由於任播在現代互聯網中的關鍵作用，先前研究已開發了執行任播普查的工具。首個工具iGreedy利用地理分散位置的延遲測量來繪製任播部署圖；第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——可在3小時內完成全網普查，但存在準確性和精確性問題。反之，iGreedy精度極高但速度較慢，且探測成本更高。本文針對這兩個系統的缺陷提出了MAnycast Reloaded（MAnycastR）。以MAnycast2為基礎，我們徹底重構了其測量流水線，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持以及類似iGreedy的延遲測量功能。我們在含32個全球分布式節點的任播測試平台上驗證MAnycastR，與外部任播生產部署對比，並通過RIPE Atlas進行廣泛延遲測量，同時針對60%以上檢測到的任播前綴與運營商真實數據進行交叉驗證。結果表明MAnycastR實現了高準確性與精確度。我們將持續提供每日MAnycastR普查數據，並以寬鬆開源協議發布工具源代碼。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：屬性圖上的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：給定圖$G$和種子節點$v_s$，局部圖聚類(LGC)的目標是在與$C_s$大小大致成線性關係的時間內，識別出圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖的應用場景。然而現有方案大多僅依賴圖中節點的拓撲連接性，容易受到現實圖數據中普遍存在的缺失或噪聲鏈接的影響。為解決該問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC建模為雙向擴散分布(BDD)的估計問題，該模型專門用於捕捉含屬性節點的多跳關聯性。進一步提出LACA方法——一種高效且具備強局部性的LGC解決方案，在多個真實數據集上表現出卓越性能。其核心組件包括：(i)快速且理論完備的節點屬性預處理技術；(ii)具有嚴格理論保證和加速收斂特性的自適應向量擴散算法；(iii)高效的三步式BDD近似方案。通過在8個真實數據集上與17種對比方法的實驗表明，LACA在真實局部簇的衡量標準下結果質量最優，同時速度可提升數個數量級。代碼已開源在https://github.com/HaoranZ99/alac。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重構動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成了任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會新陳代謝系統。供應鏈網絡絕非靜態，而是通過企業的進出和供應關係的重組不斷變化。本文利用獨特數據集研究了一個國家供應鏈網絡中企業及其供應商-客戶關係的時間演化。基於匈牙利2014至2022年每月報告的增值稅數據，我們重建了包含711,248家企業和38,644,400條連接的整體經濟網絡，以企業級分辨率覆蓋了幾乎整個經濟體的所有重構事件。研究發現：每年約25%的企業退出供應鏈網絡，同時28%的新企業加入；平均而言，當年存在的供應鏈接中有55%會在次年消失；供應鏈接的半衰期為13個月。新鏈接以超偏好概率$p(i)\propto k_i^{1.08}$依附企業（$k_i$表示企業i的供應連接數）。我們校準了一個能復現匈牙利主導供應鏈網絡典型特徵的簡單統計網絡生成模型，該模型不僅復現了入/出度分布、同配性和聚類結構等局部網絡特徵，還捕捉了真實的系統性風險特徵。最後討論了當前模型如何通過經濟重連動態來量化其韌性和估計衝擊傳導。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數極大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：我們研究一維高斯位置混合的非參數極大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定n個數據點時該估計量始終返回最多含n個分量的混合分布，而近期(Wu-Polyanskiy, 2020)對亞高斯數據給出了嚴格的$O(\log n)$界。本文重點研究$\widehat{\pi}$的計算特性：提出一種算法，當$\varepsilon>0$足夠小時，可在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算得到$\widehat\pi$的Wasserstein距離$\varepsilon$-近似解。其中$K$與數據相關但與$\varepsilon$無關，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子數。我們還可在有限時間內確定性計算$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有密度函數（相對於Lebesgue測度）的概率分布獨立採樣生成時，這些保證幾乎必然成立。進一步證明：當$k\leq \sqrt{n}/3$時，限定為k原子分布的$\widehat\pi$條件分布在相應$2k-1$維參數空間上存在密度函數，且EM算法幾乎必然具有局部線性收斂性。關鍵工具之一是非退化曲線的經典傅里葉分析估計。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：一個開放、快速、可靠且高效的每日任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過在多位置複製地址來實現降低延遲和增強韌性等目標。由於任播在現代互聯網中的關鍵作用，先前研究已開發了執行任播普查的工具。首個工具iGreedy利用地理分散節點的延遲測量來繪製任播部署圖；第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——可在3小時內完成全網普查，但存在準確性和精確度問題。相反，iGreedy精度極高但速度較慢，且探測成本更高。本文針對這兩個系統的缺陷提出了MAnycast Reloaded（MAnycastR）。以MAnycast2為基礎，我們徹底重構了其測量管道，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持，以及類似iGreedy的延遲測量功能。我們在含32個全球分布式節點的任播測試平台上驗證MAnycastR，對比實際任播生產部署，並通過RIPE Atlas進行大規模延遲測量，同時將檢測到的60%以上任播前綴與運營商真實數據交叉核驗。結果表明MAnycastR具備高準確性與精確度。我們將持續提供每日MAnycastR普查數據，並以寬鬆開源協議發布工具源代碼。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子勢的聚合物電解質膜質子傳輸大規模長時原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢（MLIPs）作為一種能夠實現大規模、長時間原子尺度模擬的方法，同時保持與基於密度泛函理論（DFT）和第一性原理波函數理論的電子結構計算相當的精度，引起了廣泛關注。然而，基於MLIP的分子動力學（MD）模擬面臨的挑戰是其穩定性低於使用傳統經典勢的模擬。分析高度異質體系或非晶材料通常需要大規模和長時間的模擬，因此需要開發能夠實現穩定MD模擬的魯棒MLIPs。在本研究中，我們利用自研的神經網絡勢（NNP）生成器，構建了一個NNP模型，能夠在廣泛水合水平下對全氟離聚物膜（Nafion）進行大規模、長時間的MD模擬。通過主動學習循環迭代擴展數據集，我們成功建立了魯棒的深度勢（DP）模型。具體而言，通過將非平衡 DPMD模擬採樣的非平衡結構與結合最小原子間距的三維結構特徵空間中的結構篩選相結合，可顯著提升DP模型的魯棒性，從而實現對約10,000至20,000個原子的大型Nafion體系進行長達31 ns的穩定MD模擬。採用所開發DP模型的MD模擬獲得的氫原子自擴散係數，在廣泛水合水平範圍內比先前小體系的第一性原理 MD模擬結果更接近實驗值。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：基於屬性圖的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：給定圖$G$和種子節點$v_s$，局部圖聚類(LGC)的目標是在與$C_s$大小大致成線性關係的時間內，識別出圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖數據的眾多應用場景。然而，現有解決方案大多僅依賴圖中節點的拓撲連接關係，容易受到現實圖數據中普遍存在的缺失鏈接或噪聲鏈接的影響。為解決這一問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC問題建模為雙向擴散分布(BDD)的估計問題，該方法專門用於捕捉帶屬性節點的多跳關聯性。進一步提出LACA算法——一種高效且具備強局部性的LGC解決方案，在多個真實數據集上展現出卓越性能。LACA的核心組件包括：(i)基於理論基礎的快速節點屬性預處理技術；(ii)具備嚴格理論保證和加速收斂特性的自適應向量擴散算法；(iii)有效的BDD近似三步驟方案。通過在8個真實數據集上與17種對比方法的實驗表明，LACA在真實局部簇的衡量標準下結果質量最優，同時速度可提升數個數量級。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重構動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成了任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會新陳代謝系統。供應鏈網絡絕非靜態存在，而是通過企業的進出和供應關係的重組不斷變化。本文利用獨特數據集研究了一個國家供應鏈網絡中企業及其供應商-採購商關係的時間演化。基於匈牙利2014至2022年每月報告的增值稅數據，我們重建了包含711,248家企業和38,644,400條連接的整體經濟網絡，以企業級分辨率覆蓋了幾乎整個經濟體的所有重構事件。研究發現：每年約25%的企業退出供應鏈網絡，同時28%的新企業加入；平均而言，當年存在的供應鏈接中有55%會在次年消失；供應鏈接的半衰期為13個月。新鏈接以超偏好概率$p(i)\propto k_i^{1.08}$依附企業（$k_i$表示企業$i$的供應連接數）。我們校準了一個能復現匈牙利主導供應鏈網絡典型特徵的簡單統計網絡生成模型，該模型不僅復現了入/出度分布、同配性和聚類結構等局部網絡特徵，還捕捉了真實的系統性風險特徵。最後討論了當前模型如何通過經濟重連動態來量化其韌性並評估衝擊傳導。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數極大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：我們研究一維高斯位置混合模型的非參數最大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定n個數據點時該估計量總是返回最多含n個分量的混合模型，而近期(Wu-Polyanskiy, 2020)對亞高斯數據給出了精確的$O(\log n)$界。本文重點研究$\widehat{\pi}$的計算特性：提出一種算法能在足夠小的$\varepsilon>0$時，以$K+Cnk^2\log\log(1/\varepsilon)$時間計算Wasserstein距離下的$\varepsilon$近似解，其中$K$與數據相關但與$\varepsilon$無關，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子數。我們還可在有限時間內確定性計算$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$來自具有密度（相對於Lebesgue測度）的概率分布時，這些保證幾乎必然成立。同時證明：當$k\leq \sqrt{n}/3$時，限定為k原子分布的$\widehat\pi$在其$2k-1$維參數空間上存在密度，且EM算法幾乎必然具有局部線性收斂性。關鍵工具之一是對非退化曲線的經典傅里葉分析估計。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：一個開放、快速、可靠且高效的每日任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過在多位置複製地址來實現降低延遲和增強韌性等目標。由於任播在現代互聯網中的關鍵作用，先前研究已開發了執行任播普查的工具。首個工具iGreedy利用地理分散節點的延遲測量來繪製任播部署圖；第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——可在3小時內完成全網普查，但存在準確性和精確性問題。相反，iGreedy精度極高但速度較慢，且探測成本更高。本文針對這兩個系統的缺陷提出了MAnycast Reloaded（MAnycastR）。以MAnycast2為基礎，我們徹底重構了其測量流水線，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持以及類似iGreedy的延遲測量功能。我們在含32個全球分布式節點的任播測試平台上驗證MAnycastR，對比實際任播生產部署，並通過RIPE Atlas進行大規模延遲測量，同時將檢測到的60%以上任播前綴與運營商真實數據進行交叉驗證。結果表明MAnycastR具備高準確性和精確性。我們以寬鬆開源協議發布工具源代碼，並向社區提供持續的每日MAnycastR普查數據。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子勢的聚合物電解質膜質子傳輸大規模長時原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢（MLIPs）作為一種能夠實現大規模、長時間原子尺度模擬的方法，同時保持與基於密度泛函理論（DFT）和從頭算波函數理論的電子結構計算相當的精度，引起了廣泛關注。然而，基於MLIP的分子動力學（MD）模擬面臨的挑戰是其穩定性低於使用傳統經典勢的模擬。分析高度異質體系或非晶材料通常需要大規模和長時間的模擬，因此需要開發能夠實現穩定MD模擬的魯棒性MLIP。在本研究中，我們利用自研的神經網絡勢（NNP）生成器，構建了一個NNP模型，該模型能夠在廣泛水合水平範圍內對全氟磺酸離聚物膜（Nafion）進行大規模、長時間的MD模擬。通過主動學習循環迭代擴展數據集，我們成功建立了魯棒的深度勢（DP）模型。具體而言，通過將非平衡 DPMD模擬採樣的非平衡結構與結合最小原子間距的三維結構特徵空間中的結構篩選相結合，可顯著提升DP模型的魯棒性，從而實現對約10,000至20,000個原子的大型Nafion體系進行長達31 ns的穩定MD模擬。採用所開發DP模型的MD模擬獲得的氫原子自擴散係數，在廣泛水合水平範圍內比先前小體系從頭算MD模擬結果更接近實驗值。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：屬性圖上的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：給定圖$G$和種子節點$v_s$，局部圖聚類（LGC）的目標是在與$C_s$大小近似線性時間內識別出圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖的應用場景。然而現有方案大多僅依賴圖中節點的拓撲連接性，容易受到現實圖譜中普遍存在的缺失邊或噪聲邊的影響。為此，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC建模為雙向擴散分布（BDD）估計問題，該模型專門用於捕捉帶屬性節點的多跳關聯性。進一步提出LACA方法，其核心組件包括：(i) 基於理論基礎的快速節點屬性預處理技術；(ii) 具有嚴格理論保證和加速收斂特性的自適應向量擴散算法；(iii) 高效的BDD近似三步驟方案。在8個真實數據集上與17種方法的對比實驗表明，LACA在真實局部簇的評估指標上全面超越現有方法，同時速度提升達數量級。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重構動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成了任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會新陳代謝系統。SCN絕非靜態存在，而是通過企業的進出和供應關係的重組持續演變。本研究利用獨特數據集追蹤了一個國家SCN中企業及其供應商-客戶關係的時間演化。基於匈牙利2014至2022年每月增值稅數據，我們重建了包含711,248家企業和38,644,400條連接的完整經濟網絡，以企業級分辨率捕捉了整個經濟體的每次重構事件。研究發現：每年約25%企業退出SCN，同時28%新企業加入；平均55%的年度供應關係會在次年消失；供應關係的半衰期為13個月。新連接以超偏好依附概率$p(i)\propto k_i^{1.08}$（$k_i$為企業i的連接數）形成。我們校準的簡單統計網絡生成模型成功復現了匈牙利主導SCN的特徵模式，不僅能重現入/出度分布、同配性和聚類結構等局部特徵，還能捕捉真實的系統性風險輪廓。該模型揭示了經濟網絡重連動態對量化系統韌性和估計衝擊傳導的關鍵作用。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數極大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：我們研究一維高斯位置混合模型的非參數極大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定n個數據點時該估計量總是返回最多含n個分量的混合模型，而近期(Wu-Polyanskiy, 2020)對亞高斯數據給出了嚴格的$O(\log n)$界。本文研究$\widehat{\pi}$的計算特性：提出一種算法，當$\varepsilon>0$足夠小時，可在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算得到$\widehat\pi$的Wasserstein距離$\varepsilon$-近似解。其中$K$與數據相關但與$\varepsilon$無關，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子數。我們還可在有限時間內確定性計算$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$來自具有密度（相對於Lebesgue測度）的概率分布時，這些保證幾乎必然成立。我們還證明：當$k\leq \sqrt{n}/3$時，限定為k原子的$\widehat\pi$條件分布在相應$2k-1$維參數空間上存在密度，且EM算法幾乎必然具有局部線性收斂性。關鍵工具之一是對非退化曲線的經典傅里葉分析估計。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：一個開放、快速、可靠且高效的每日任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過在多位置複製地址來實現降低延遲和增強韌性等目標。由於任播在現代互聯網中的關鍵作用，先前研究已開發了執行任播普查的工具。首個工具iGreedy利用地理分散位置的延遲測量來映射任播部署；第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——可在3小時內完成全網普查，但存在準確性和精確度問題。相反，iGreedy精度極高但速度較慢，且探測成本更高。本文針對這兩個系統的缺陷，提出了MAnycast Reloaded（MAnycastR）。以MAnycast2為基礎，我們徹底重新設計了其測量管道，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持，以及類似iGreedy的延遲測量功能。我們在含32個全球分布式節點的任播測試平台上驗證MAnycastR，與外部任播生產部署進行對比，通過RIPE Atlas進行廣泛延遲測量，並對檢測到的60%以上任播前綴與運營商真實數據進行交叉驗證。結果表明MAnycastR實現了高準確性和精確度。我們將持續提供每日MAnycastR普查數據，並以寬鬆開源協議發布工具源代碼。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子勢的聚合物電解質膜質子傳輸大規模長時原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢（MLIPs）作為一種能夠實現大規模、長時間原子模擬並保持與基於密度泛函理論（DFT）和從頭算波函數理論的電子結構計算相當精度的方法，引起了廣泛關注。然而，基於MLIP的分子動力學（MD）模擬面臨的挑戰是其穩定性低於使用傳統經典勢的模擬。分析高度異質體系或非晶材料通常需要大規模和長時間的模擬，因此需要開發能夠實現穩定MD模擬的魯棒MLIP。在本研究中，我們利用神經網絡勢（NNP）生成器，構建了一個NNP模型，能夠在廣泛水合水平下對全氟離子交換膜（Nafion）進行大規模、長時間的MD模擬。通過主動學習循環迭代擴展數據集，我們成功建立了深度勢（DP）模型。具體而言，通過將非平衡DPMD模擬採樣的非平衡結構與結合最小原子間距的三維結構特徵空間中的結構篩選相結合，可以顯著增強DP模型的魯棒性，從而實現對約10,000至20,000個原子的大型Nafion體系進行長達31 ns的穩定MD模擬。採用所開發DP模型的MD模擬獲得的氫原子自擴散係數，在廣泛水合水平範圍內與實驗值的吻合度優於先前對小體系進行的從頭算MD模擬結果。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：基於屬性圖的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：給定圖$G$和種子節點$v_s$，局部圖聚類（LGC）的目標是在與$C_s$大小大致成線性關係的時間內，識別出圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖的應用場景。然而現有方案大多僅依賴圖中節點的拓撲連接性，容易受到現實圖譜中普遍存在的缺失或噪聲鏈接的影響。為解決該問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC建模為雙向擴散分布（BDD）的估計問題——該模型專為捕捉帶屬性節點的多跳親和力而設計。進一步提出LACA方法，其核心組件包括：（i）基於理論基礎的快速節點屬性預處理技術；（ii）具備嚴格理論保證且加速收斂的自適應向量擴散算法；（iii）高效的三步式BDD近似方案。在8個真實數據集上與17種方法的對比實驗表明，LACA在真實局部簇的評估指標上全面優於所有對比方法，同時速度提升達數量級。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重構動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會代謝系統。SCN絕非靜態存在，而是通過企業的進出與供應關係的重組持續演變。本研究利用獨特數據集追蹤了一個國家SCN中企業及其供應商-客戶關係的時間演化。基於匈牙利2014至2022年每月增值稅數據，我們重構了包含711,248家企業和38,644,400條連接的完整經濟網絡，以企業級分辨率捕捉了整個經濟體的每次重構事件。研究發現：每年約25%的企業退出SCN，同時28%的新企業加入；平均55%的現存供應鏈接會在次年消失；供應鏈接的半衰期為13個月。新鏈接以超偏好依附概率$p(i)\propto k_i^{1.08}$（$k_i$為企業i的供應連接數）附着於企業。我們校準的簡單統計網絡生成模型成功復現了匈牙利主導SCN的典型特徵，不僅能再現入/出度分布、同配性和聚類結構等局部網絡特徵，還能捕捉真實的系統性風險輪廓。最後探討了該模型如何通過經濟重連動態來量化系統韌性及評估衝擊傳導。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數最大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：我們研究一維高斯位置混合模型的非參數極大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定n個數據點時該估計量始終返回最多含n個混合模型的分量，而近期(Wu-Polyanskiy, 2020)對亞高斯數據給出了精確的$O(\log n)$界。本文重點研究$\widehat{\pi}$的計算特性：提出一種算法，當$\varepsilon>0$足夠小時，可在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算出Wasserstein距離意義下的$\varepsilon$近似解，其中$K$與數據相關但與$\varepsilon$無關，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子數量。我們還能在有限時間內可驗證地計算出$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有密度函數（相對於Lebesgue測度）的概率分布獨立採樣生成時，這些保證幾乎必然成立。我們還證明：當$k\leq \sqrt{n}/3$時，限定為k原子結構的$\widehat\pi$條件分布在相應$2k-1$維參數空間上存在密度函數，且EM算法幾乎必然具有局部線性收斂性。關鍵工具之一是關於非退化曲線的經典傅里葉分析估計。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：一個開放、快速、可靠且高效的每日任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過將地址複製到多個位置來實現（例如）降低延遲和增強韌性。由於任播在現代互聯網中的關鍵作用，先前研究引入了執行任播普查的工具。首個工具iGreedy利用地理分散位置的延遲測量來映射任播部署；第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——可在3小時內完成全網普查，但存在準確性和精確性問題。相反，iGreedy精度極高但速度較慢，且探測成本更高。本文針對這兩個系統的缺陷提出了MAnycast Reloaded（MAnycastR）。以MAnycast2為基礎，我們徹底重構了其測量流水線，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持，以及類似iGreedy的延遲測量功能。我們在包含32個全球分布式節點的任播測試平台上驗證MAnycastR，與外部任播生產部署進行對比，並通過RIPE Atlas進行廣泛延遲測量，同時針對60%以上檢測到的任播前綴與運營商真實數據進行交叉驗證。結果表明MAnycastR實現了高準確性和精確性。我們將持續提供每日MAnycastR普查數據，並以寬鬆的開源許可協議發布該工具源代碼。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子勢的聚合物電解質膜質子傳輸大規模長時原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢（MLIPs）作為一種能夠實現大規模、長時間原子尺度模擬的方法，同時保持與基於密度泛函理論（DFT）和從頭算波函數理論的電子結構計算相當的精度，引起了廣泛關注。然而，基於MLIP的分子動力學（MD）模擬面臨的一個挑戰是，與傳統經典勢相比其穩定性較低。分析高度異質體系或非晶材料通常需要大規模和長時間的模擬，因此需要開發能夠實現穩定MD模擬的魯棒MLIP。在本研究中，我們利用自研的神經網絡勢（NNP）生成器，構建了一個NNP模型，能夠在廣泛水合水平下對全氟磺酸離子膜（Nafion）進行大規模、長時間的MD模擬。通過主動學習循環迭代擴展數據集，我們成功建立了魯棒的深度勢（DP）模型。具體而言，通過將非平衡 DPMD模擬採樣的非平衡結構與結合最小原子間距的三維結構特徵空間中的結構篩選相結合，可顯著提升DP模型的魯棒性，從而實現對約10,000至20,000個原子的大型Nafion體系進行長達31 ns的穩定MD模擬。採用所開發DP模型的MD模擬獲得的氫原子自擴散係數，在廣泛水合水平範圍內與實驗值的吻合度較先前小體系從頭算MD模擬有顯著提升。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：屬性圖上的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：給定圖$G$和種子節點$v_s$，局部圖聚類（LGC）的目標是在與$C_s$大小大致成線性關係的時間內，識別出圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖的應用場景。然而，現有解決方案大多僅依賴圖中節點的拓撲連接性，容易受到現實圖數據中普遍存在的缺失或噪聲鏈接的影響。為解決該問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC建模為雙向擴散分布（BDD）的估計問題，該模型專門用於捕捉含屬性節點的多跳關聯性。進一步提出LACA方法——一種高效且具備嚴格理論保證的LGC方案，其核心包括：(i) 基於理論基礎的快速節點屬性預處理技術；(ii) 具有自適應擴散能力和加速收斂特性的向量傳播算法；(iii) 高效的三步式BDD近似策略。在8個真實數據集上與17種對比方法的實驗表明，LACA在真實局部簇的評估指標上全面優於所有基線方法，同時實現數量級的速度提升。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重構動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成了任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會新陳代謝系統。SCN絕非靜態存在，而是通過企業的進出和供應關係的重組持續演變。本研究利用獨特數據集追蹤了一個國家SCN中企業及其供應商-客戶關係的時間演化。基於匈牙利2014至2022年每月報告的增值稅數據，我們重建了包含711,248家企業和38,644,400條連接的完整經濟網絡，以企業級分辨率捕捉了整個經濟體的每次重構事件。研究發現：每年約25%的企業退出SCN，同時28%的新企業加入；平均55%的年度供應關係會在次年消失；供應關係的半衰期為13個月。新連接以超偏好依附概率$p(i)\propto k_i^{1.08}$（$k_i$表示企業i的供應連接數）附着於企業。我們校準了一個能復現匈牙利主導SCN典型特徵的簡易統計網絡生成模型，該模型不僅再現了入度/出度分布、同配性和聚類結構等局部網絡特徵，還捕捉了真實的系統性風險特徵。最後探討了經濟重連動態對量化系統韌性和估計衝擊傳導的關鍵作用。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數極大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：我們研究一維高斯位置混合模型的非參數最大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定n個數據點時，該估計量始終返回最多含n個分量的混合模型，而近期(Wu-Polyanskiy, 2020)對亞高斯數據給出了精確的$O(\log n)$界。本文重點研究$\widehat{\pi}$的計算特性：我們提出一種算法，當$\varepsilon>0$足夠小時，可在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算得到$\widehat\pi$的Wasserstein距離$\varepsilon$-近似解，其中$K$與數據相關但與$\varepsilon$無關，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子數量。我們還可在有限時間內確定性計算$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有密度（相對於Lebesgue測度）的概率分布獨立採樣生成時，這些保證幾乎必然成立。我們進一步證明：當$\widehat\pi$被約束為k原子分布時，對所有$k\leq \sqrt{n}/3$，其在相應$2k-1$維參數空間上存在密度，且EM算法幾乎必然具有局部線性收斂性。關鍵工具之一是對非退化曲線的經典傅里葉分析估計。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：一個開放、快速、可靠且高效的每日任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過將地址複製到多個位置來實現（例如）降低延遲和增強韌性。由於任播在現代互聯網中的關鍵作用，先前研究已開發了執行任播普查的工具。首個工具iGreedy利用地理分散位置的延遲測量來映射任播部署；第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——可在3小時內完成全網普查，但存在準確性和精確性問題。相反，iGreedy精度極高但速度較慢，且探測成本更高。本文針對這兩個系統的缺陷提出了MAnycast Reloaded（MAnycastR）。基於MAnycast2，我們徹底重構了其測量流水線，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持以及類似iGreedy的延遲測量功能。我們在含32個全球分布式節點的任播測試平台上驗證MAnycastR，與外部任播生產部署對比，並通過RIPE Atlas進行大規模延遲測量，同時將檢測到的60%以上任播前綴與運營商真實數據交叉核驗。結果表明MAnycastR實現了高準確性與精確度。我們以寬鬆開源協議向社區提供每日持續的MAnycastR普查數據，並公開該工具的源代碼。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子間勢的聚合物電解質膜質子傳輸大規模長時原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢（MLIPs）作為一種能夠實現大規模、長時間原子模擬並保持與基於密度泛函理論（DFT）和從頭算波函數理論的電子結構計算相當精度的方法，引起了廣泛關注。然而，基於MLIP的分子動力學（MD）模擬面臨的關鍵挑戰是其穩定性低於傳統經典勢函數。分析高度異質體系或非晶材料通常需要大規模長時間模擬，這要求開發能夠實現穩定MD模擬的魯棒性MLIP。本研究利用自研神經網絡勢（NNP）生成器，構建了可在廣泛水合度範圍內對全氟離聚物膜（Nafion）進行大規模長時間MD模擬的NNP模型。通過主動學習循環迭代擴展數據集，我們成功建立了魯棒的深度勢（DP）模型。具體而言，通過將非平衡態 DPMD模擬採樣的非平衡結構與融合最小原子間距的三維結構特徵空間篩選相結合，可顯著提升DP模型的魯棒性，從而實現對約10,000至20,000原子的大型Nafion體系持續31納秒的穩定MD模擬。採用所開發DP模型的MD模擬獲得的氫原子自擴散係數，在寬水合度範圍內比先前小體系從頭算MD模擬結果更接近實驗值。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：基於屬性圖的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：給定圖$G$和種子節點$v_s$，局部圖聚類(LGC)的目標是在與$C_s$大小近似線性時間內識別圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖的應用場景。然而現有方案大多僅依賴圖中節點的拓撲連接性，容易受到現實圖數據中普遍存在的缺失或噪聲鏈接的影響。為解決該問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC建模為雙向擴散分布(BDD)的估計問題——該分布專門用於捕捉帶屬性節點的多跳關聯性。進一步提出LACA方法，其核心組件包括：(i)基於理論基礎的快速節點屬性預處理技術；(ii)具備理論保證和加速收斂特性的自適應向量擴散算法；(iii)高效的BDD近似三步驟方案。在8個真實數據集上與17種方法的對比實驗表明，LACA在真實局部簇的評估指標上全面優於所有對比方法，同時實現數量級的速度提升。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重構動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會新陳代謝系統。SCN絕非靜態存在，而是通過企業的進出與供應關係的重組持續演變。本研究利用獨特數據集追蹤了一個國家SCN中企業及其供需關係的時序演化。基於匈牙利2014至2022年每月報告的增值稅數據，我們重構了包含711,248家企業和38,644,400條連接的完整經濟網絡，以企業級分辨率捕捉了整個經濟體的每次重構事件。研究發現：每年約25%的企業退出SCN，同時28%的新企業加入；平均55%的現存供應鏈接會在次年消失；供應鏈接的半衰期為13個月。新鏈接以超偏好依附概率$p(i)\propto k_i^{1.08}$（$k_i$表示企業i的供應連接數）附着於企業。我們校準了一個能復現匈牙利主導SCN典型特徵的簡易統計網絡生成模型，該模型不僅重現了入/出度分布、同配性和聚類結構等局部網絡特徵，還捕捉了真實的系統性風險輪廓。最後探討了經濟重連動態對量化系統韌性和估計衝擊傳導的關鍵作用。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數最大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：我們研究一維高斯位置混合模型的非參數極大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定n個數據點時，該估計量總是返回最多含n個分量的混合模型，而近期(Wu-Polyanskiy, 2020)對次高斯數據給出了精確的$O(\log n)$界。本文重點研究$\widehat{\pi}$的計算特性：我們提出一種算法，當$\varepsilon>0$足夠小時，可在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算出Wasserstein距離意義上的$\varepsilon$近似解，其中$K$與數據相關但與$\varepsilon$無關，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子數量。我們還可在有限時間內確定性計算出$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$來自具有密度（相對於Lebesgue測度）的概率分布時，這些保證幾乎必然成立。我們進一步證明：當$k\leq \sqrt{n}/3$時，限定為k原子性的$\widehat\pi$條件分布在相關$2k-1$維參數空間上存在密度，且EM算法幾乎必然具有局部線性收斂性。關鍵工具之一是針對非退化曲線的經典傅里葉分析估計。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：開放、快速、可靠且高效的日常任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過在多位置複製地址來實現降低延遲和增強韌性等目標。由於任播在現代互聯網中的關鍵作用，先前研究已開發了執行任播普查的工具。首個工具iGreedy利用地理分散節點的延遲測量來繪製任播部署圖；第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——可在3小時內完成全網普查，但存在準確性和精確度問題。相反，iGreedy精度極高但速度較慢，且探測成本更高。本文針對這兩個系統的缺陷，提出了MAnycast Reloaded（MAnycastR）。以MAnycast2為基礎，我們徹底重構了其測量管道，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持以及類似iGreedy的延遲測量功能。我們在含32個全球分布式節點的任播測試平台上驗證MAnycastR，對比外部任播生產部署，通過RIPE Atlas進行廣泛延遲測量，並將檢測到的60%以上任播前綴與運營商真實數據交叉核驗。結果表明MAnycastR實現了高準確性與精確度。我們以寬鬆開源協議發布工具源碼，並向社區提供持續的每日MAnycastR普查數據。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子勢的聚合物電解質膜質子傳輸大規模長時原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢（MLIPs）作為一種能夠實現大規模、長時間原子模擬並保持與基於密度泛函理論（DFT）和從頭算波函數理論的電子結構計算相當精度的方法，受到了廣泛關注。然而，基於MLIP的分子動力學（MD）模擬面臨的關鍵挑戰是其穩定性低於傳統經典勢函數。分析高度異質體系或非晶材料通常需要大規模長時間模擬，因此亟需開發能夠支持穩定MD模擬的魯棒性MLIP。本研究利用自主開發的神經網絡勢（NNP）生成器，構建了可在廣泛水合水平範圍內對全氟離聚物膜（Nafion）進行大規模長時間MD模擬的NNP模型。通過主動學習循環迭代擴展數據集，我們成功建立了魯棒的深度勢（DP）模型。具體而言，通過將非平衡態 DPMD模擬採樣的非平衡結構與融合最小原子間距的三維結構特徵空間篩選相結合，顯著提升了DP模型的魯棒性，使得對約10,000至20,000個原子的大規模Nafion體系進行長達31納秒的穩定MD模擬成為可能。採用所開發DP模型的MD模擬獲得的氫原子自擴散係數，在廣泛水合水平範圍內比先前小體系從頭算MD模擬結果更接近實驗值。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：屬性圖上的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：給定圖$G$和種子節點$v_s$，局部圖聚類（LGC）的目標是在與$C_s$大小大致成線性關係的時間內，識別出圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，使其非常適用於涉及大規模圖的眾多應用場景。然而，現有解決方案大多僅依賴圖中節點的拓撲連接性，容易受到現實圖數據中普遍存在的缺失鏈接或噪聲鏈接的影響。為解決這一問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC建模為雙向擴散分布（BDD）的估計問題，該模型專門用於捕捉含屬性節點的多跳關聯性。進一步提出LACA方法——一種高效且具備嚴格理論保證的LGC解決方案，其核心組件包括：(i) 基於理論基礎的快速節點屬性預處理技術，(ii) 具有自適應擴散能力和加速收斂特性的向量傳播算法， (iii) 高效的三步式BDD近似方案。通過在8個真實數據集上與17種對比方法的實驗表明，LACA在真實局部簇的評估指標上全面優於所有對比方法，同時速度提升達數量級。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重構動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會新陳代謝系統。SCN絕非靜態存在，而是通過企業的進出和供應關係的重組持續演變。本文利用獨特數據集研究了一個國家SCN中企業及其供應商-買方關係的時間演化。基於匈牙利2014至2022年按月申報的增值稅數據，我們重建了包含711,248家企業和38,644,400條連接的整體經濟網絡，以企業級分辨率覆蓋了幾乎整個經濟體的所有重構事件。研究發現：每年約25%的企業退出SCN，同時28%的新企業加入；平均55%的現存供應鏈接會在次年消失；供應鏈接的半衰期為13個月。新鏈接以超偏好概率$p(i)\propto k_i^{1.08}$依附企業（$k_i$表示企業i的供應連接數）。我們校準了一個能復現匈牙利主導SCN典型特徵的簡易統計網絡生成模型，該模型不僅重現了入/出度分布、同配性和聚類結構等局部網絡特徵，還捕捉了真實的系統性風險輪廓。最後討論了經濟重連動態對量化系統韌性和估計衝擊傳導的關鍵作用。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數最大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：我們研究一維高斯位置混合模型的非參數極大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定n個數據點時該估計量總是返回最多含n個分量的混合模型，而近期(Wu-Polyanskiy, 2020)對亞高斯數據給出了精確的$O(\log n)$界。本文研究$\widehat{\pi}$的計算特性：我們提出一種算法，當$\varepsilon>0$足夠小時，可在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算出Wasserstein距離意義上的$\varepsilon$近似解，其中$K$與數據相關但與$\varepsilon$無關，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子數量。我們還可在有限時間內確定性計算出$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有密度函數（相對於Lebesgue測度）的概率分布獨立採樣生成時，這些保證幾乎必然成立。我們還證明：當$k\leq \sqrt{n}/3$時，限定為k原子的$\widehat\pi$條件分布在對應的$2k-1$維參數空間上存在密度函數，且EM算法幾乎必然具有局部線性收斂性。關鍵工具之一是針對非退化曲線的經典傅里葉分析估計。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：一個開放、快速、可靠且高效的每日任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過將地址複製到多個位置來實現（例如）降低延遲和增強韌性。由於任播在現代互聯網中的關鍵作用，先前研究已引入執行任播普查的工具。首個工具iGreedy利用地理分散位置的延遲測量來映射任播部署；第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——可在3小時內完成全網普查，但存在準確性和精確性問題。相反，iGreedy精度極高但速度較慢，且探測成本更高。本文針對這兩個系統的缺陷，提出了MAnycast Reloaded（MAnycastR）。以MAnycast2為基礎，我們徹底重新設計了其測量流水線，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持，以及類似iGreedy的延遲測量功能。我們在含32個全球分布式節點的任播測試平台上驗證MAnycastR，與外部任播生產部署對比，並通過RIPE Atlas進行廣泛延遲測量，同時將檢測到的60%以上任播前綴與運營商真實數據交叉核驗。結果表明MAnycastR實現了高準確性與精確度。我們以寬鬆開源協議向社區提供每日持續的MAnycastR普查數據，並公開該工具的源代碼。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子勢的聚合物電解質膜質子傳輸大規模長時原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢（MLIPs）作為一種能夠實現大規模、長時間原子尺度模擬的方法，同時保持與基於密度泛函理論（DFT）和第一性原理波函數理論的電子結構計算相當的精度，引起了廣泛關注。然而，基於MLIP的分子動力學（MD）模擬面臨的一個挑戰是，與傳統經典勢相比其穩定性較低。分析高度異質體系或非晶材料通常需要大規模和長時間的模擬，因此需要開發能夠實現穩定MD模擬的魯棒性MLIPs。在本研究中，我們利用自研的神經網絡勢（NNP）生成器，構建了一個NNP模型，該模型能夠對不同水合水平的全氟離聚物膜（Nafion）進行大規模、長時間的MD模擬。通過主動學習循環迭代擴展數據集，我們成功建立了魯棒的深度勢（DP）模型。具體而言，通過將非平衡DPMD模擬採樣的非平衡結構與結合最小原子間距的三維結構特徵空間中的結構篩選相結合，可以顯著增強DP模型的魯棒性，從而實現對約10,000至20,000個原子的大型Nafion體系進行長達31 ns的穩定MD模擬。採用所開發DP模型進行的MD模擬獲得的氫原子自擴散係數，與先前較小體系的第一性原理 MD模擬相比，在更廣泛的水合水平範圍內與實驗值更為吻合。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：屬性圖上的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：給定圖$G$和種子節點$v_s$，局部圖聚類(LGC)的目標是在與$C_s$大小大致成線性關係的時間內，識別出圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖的應用場景。然而，現有解決方案大多僅依賴圖中節點的拓撲連接關係，容易受到現實圖數據中普遍存在的缺失鏈接或噪聲鏈接的影響。為解決這一問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC問題建模為雙向擴散分布(BDD)的估計問題，該模型專門用於捕捉含屬性圖中節點的多跳關聯性。進一步提出LACA方法——一種高效且具備嚴格理論保證的LGC解決方案：其核心組件包括(i)快速且理論完備的節點屬性預處理技術，(ii)具有理論收斂保證的自適應向量擴散算法，(iii)高效的三步式BDD近似方案。通過在8個真實數據集上與17種對比方法的實驗表明，LACA在真實局部簇的衡量標準下均優於所有對比方法，同時速度提升達數量級。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重構動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成了任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會新陳代謝系統。SCN絕非靜態存在，而是通過企業的進出和供應關係的重組持續演變。本文利用獨特數據集研究了一個國家SCN中企業及其供應商-客戶關係的時間演化。基於匈牙利2014至2022年每月報告的增值稅數據，我們重建了包含711,248家企業和38,644,400條連接的整體經濟網絡，以企業級分辨率覆蓋了幾乎所有的經濟重構事件。研究發現：每年約25%的企業退出SCN，同時28%的新企業加入；平均55%的年度供應關係會在次年消失；供應關係的半衰期為13個月。新連接以超偏好概率$p(i)\propto k_i^{1.08}$依附企業（$k_i$表示企業i的供應連接數）。我們校準了一個能復現匈牙利主導SCN典型特徵的簡單統計網絡生成模型，該模型不僅再現了入度/出度分布、同配性和聚類結構等局部網絡特徵，還捕捉了真實的系統性風險輪廓。最後討論了經濟重連動態對量化系統韌性和估計衝擊傳導的關鍵作用。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數最大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：我們研究一維高斯位置混合模型的非參數最大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定n個數據點時，該估計量始終返回最多含n個分量的混合模型，而近期(Wu-Polyanskiy, 2020)對亞高斯數據給出了嚴格的$O(\log n)$界。本研究聚焦$\widehat{\pi}$的計算特性：我們提出一種算法，當$\varepsilon>0$足夠小時，可在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算得到$\widehat\pi$的Wasserstein距離$\varepsilon$-近似解。其中$K$與數據相關但獨立於$\varepsilon$，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子數量。我們還實現了支撐集大小$|supp(\widehat\pi)|$的有限時間可驗證計算。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有密度（相對於Lebesgue測度）的概率分布獨立採樣生成時，這些保證幾乎必然成立。我們進一步證明：對於所有$k\leq \sqrt{n}/3$，限定為k原子結構的$\widehat\pi$條件分布在相應$2k-1$維參數空間上具有密度，且EM算法幾乎必然具有局部線性收斂性。關鍵工具之一是對非退化曲線的經典傅里葉分析估計。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：一個開放、快速、可靠且高效的每日任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過在多位置複製地址來實現降低延遲和增強韌性等目標。由於任播在現代互聯網中的關鍵作用，先前研究已開發了執行任播普查的工具。首個工具iGreedy利用地理分散位置的延遲測量來映射任播部署；第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——可在3小時內完成全網普查，但存在準確性和精確性問題。相反，iGreedy精度極高但速度較慢，且探測成本更高。本文針對這兩個系統的缺陷提出了MAnycast Reloaded（MAnycastR）。以MAnycast2為基礎，我們徹底重新設計了其測量管道，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持，以及類似iGreedy的延遲測量功能。我們在含32個全球分布式節點的任播測試平台上驗證MAnycastR，與外部任播生產部署進行對比，並通過RIPE Atlas進行廣泛延遲測量，同時對檢測到的60%以上任播前綴進行運營商真實數據交叉驗證。結果表明MAnycastR實現了高準確性與精確度。我們將持續提供每日MAnycastR普查數據，並以寬鬆開源協議發布工具源代碼。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子勢的聚合物電解質膜質子傳輸大規模長時原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢（MLIPs）作為一種能夠實現大規模、長時間原子模擬並保持與基於密度泛函理論（DFT）和從頭算波函數理論的電子結構計算相當精度的方法，引起了廣泛關注。然而，基於MLIP的分子動力學（MD）模擬面臨的挑戰是其穩定性低於使用傳統經典勢的模擬。分析高度異質體系或非晶材料通常需要大規模和長時間的模擬，因此需要開發能夠實現穩定MD模擬的魯棒MLIP。在本研究中，我們利用自研的神經網絡勢（NNP）生成器，構建了一個NNP模型，該模型能夠對全氟磺酸離聚物膜（Nafion）在不同水合水平下進行大規模、長時間的MD模擬。通過主動學習循環迭代擴展數據集，我們成功建立了魯棒的深度勢（DP）模型。具體而言，通過將非平衡DPMD模擬採樣的非平衡結構與結合最小原子間距的三維結構特徵空間中的結構篩選相結合，可顯著提升DP模型的魯棒性，從而實現對約10,000至20,000個原子的大型Nafion體系進行長達31 ns的穩定MD模擬。採用所開發DP模型的MD模擬獲得的氫原子自擴散係數，在廣泛水合水平範圍內比先前小體系從頭算MD模擬結果更接近實驗值。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：屬性圖上的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：給定圖$G$和種子節點$v_s$，局部圖聚類（LGC）的目標是在與$C_s$大小近似線性相關的時間內，識別出圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖的應用場景。然而，現有解決方案大多僅依賴圖中節點的拓撲連接關係，容易受到現實圖數據中普遍存在的缺失鏈接或噪聲鏈接的影響。為解決該問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC建模為雙向擴散分布（BDD）的估計問題，該模型專門用於捕捉帶屬性節點的多跳關聯性。進一步提出LACA方法——一種高效且具備嚴格理論保證的LGC解決方案，其核心包括：(i) 快速且理論完備的節點屬性預處理技術，(ii) 具有理論收斂保證的自適應向量擴散算法，(iii) 高效的三步式BDD近似方案。在8個真實數據集上與17種基線方法的對比實驗表明，LACA在真實局部簇的評估指標上全面優於所有對比方法，同時速度提升達數量級。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：Supply chain network rewiring dynamics at the firm-level
中文標題：企業層面的供應鏈網絡重構動態
發布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分類：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文鏈接：http://arxiv.org/abs/2503.20594v1

中文摘要：供應鏈網絡（SCN）構成任何社會的結構性支柱。它們通過協調地球上幾乎每一個個體，形成了為所有人生產一切的社會新陳代謝系統。SCN絕非靜態存在，而是通過企業的進出與供應關係的重組持續演變。本研究利用獨特數據集追蹤了一個國家SCN中企業及其供需關係的時序演化。基於匈牙利2014至2022年每月報告的增值稅數據，我們重建了包含711,248家企業和38,644,400條連接的完整經濟網絡，以企業級分辨率捕捉了整個經濟體的每次重構事件。研究發現：每年約25%的企業退出SCN，同時28%的新企業加入；平均55%的年度供應關係會在次年消失；供應關係的半衰期為13個月。新連接以超偏好依附方式鏈接企業，概率滿足$p(i)\propto k_i^{1.08}$（$k_i$表示企業i的供應連接數）。我們校準的簡易統計網絡生成模型成功復現了匈牙利主導SCN的典型特徵，不僅能重現入/出度分布、同配性和聚類結構等局部網絡特徵，還可捕捉真實的系統性風險輪廓。該模型揭示了經濟網絡重連動態對量化系統韌性和估計衝擊傳導的關鍵作用。

摘要

原文標題：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文標題：高斯位置混合的非參數最大似然估計：可驗證計算與通用行為
發布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分類：math.ST, stat.ML, stat.TH
原文鏈接：http://arxiv.org/abs/2503.20193v1

中文摘要：我們研究一維高斯位置混合的非參數極大似然估計量$\widehat{\pi}$。自(Lindsay, 1983)以來已知，給定n個數據點時該估計量始終返回最多含n個混合分布的分量，而近期(Wu-Polyanskiy, 2020)對亞高斯數據給出了嚴格的$O(\log n)$界。本文研究$\widehat{\pi}$的計算特性：提出一種算法，當$\varepsilon>0$足夠小時，可在$K+Cnk^2\log\log(1/\varepsilon)$時間內計算得到$\widehat\pi$的Wasserstein距離$\varepsilon$-近似解。其中$K$與數據相關但獨立於$\varepsilon$，$C$為絕對常數，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子數。我們還可在有限時間內確定性計算$|supp(\widehat\pi)|$的精確值。當數據集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有密度函數（相對於Lebesgue測度）的概率分布獨立採樣時，這些保證幾乎必然成立。同時證明：當$k\leq \sqrt{n}/3$時，限定為k原子分布的$\widehat\pi$條件分布在相應$2k-1$維參數空間上存在密度函數，且EM算法幾乎必然具有局部線性收斂性。關鍵工具之一是對非退化曲線的經典傅里葉分析估計。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：開放、快速、可靠且高效的每日任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過將地址複製到多個位置來實現（例如）降低延遲和增強韌性。由於任播在現代互聯網中的關鍵作用，先前研究已開發了執行任播普查的工具。首個工具iGreedy利用地理分散位置的延遲測量來映射任播部署；第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——可在3小時內完成全網普查，但存在準確性和精確度問題；而iGreedy雖然高度準確，但速度較慢且探測成本更高。本文針對這兩個系統的缺陷，提出了MAnycast Reloaded（MAnycastR）。我們以MAnycast2為基礎，徹底重構其測量流水線，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持以及類似iGreedy的延遲測量功能。通過在含32個全球分布式節點的任播測試床上驗證MAnycastR，對比外部任播生產部署和RIPE Atlas的大規模延遲測量數據，並對檢測到的60%以上任播前綴進行運營商真實數據交叉檢驗，證明MAnycastR具備高準確性和精確度。我們將持續提供每日MAnycastR普查數據，並以寬鬆開源協議發布工具源代碼。

摘要

原文標題：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文標題：基於神經網絡原子間勢的聚合物電解質膜質子傳輸大規模長時原子模擬
發布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分類：cond-mat.mtrl-sci, physics.comp-ph
原文鏈接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年來，機器學習原子間勢（MLIPs）作為一種能夠實現大規模、長時間原子模擬並保持與基於密度泛函理論（DFT）和從頭算波函數理論的電子結構計算相當精度的方法，引起了廣泛關注。然而，基於MLIP的分子動力學（MD）模擬面臨的挑戰是其穩定性低於使用傳統經典勢的模擬。分析高度異質體系或非晶材料通常需要大規模和長時間的模擬，因此需要開發能夠實現穩定MD模擬的魯棒MLIP。在本研究中，我們利用自研的神經網絡勢（NNP）生成器，構建了一個NNP模型，能夠在廣泛水合水平下對全氟磺酸離子膜（Nafion）進行大規模、長時間的MD模擬。通過主動學習循環迭代擴展數據集，我們成功建立了魯棒的深度勢（DP）模型。具體而言，通過將非平衡DPMD模擬採樣的非平衡結構與結合最小原子間距的三維結構特徵空間中的結構篩選相結合，可顯著提升DP模型的魯棒性，從而實現對約10,000至20,000個原子的大型Nafion體系進行長達31 ns的穩定MD模擬。採用所開發DP模型的MD模擬獲得的氫原子自擴散係數，在廣泛水合水平範圍內比先前較小體系的從頭算MD模擬結果更接近實驗值。

摘要

原文標題：Adaptive Local Clustering over Attributed Graphs
中文標題：基於屬性圖的自適應局部聚類
發布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分類：cs.SI, cs.DS, cs.LG
原文鏈接：http://arxiv.org/abs/2503.20488v1

中文摘要：給定屬性圖$G$和種子節點$v_s$，局部圖聚類(LGC)的目標是在與$C_s$大小近似線性相關的時間內，識別出圍繞$v_s$的子圖$C_s$（即局部簇）。這種方法無需訪問整個圖即可生成個性化簇，使其特別適用於涉及大規模圖的應用場景。然而現有方案大多僅依賴圖中節點的拓撲連接性，容易受到現實圖中普遍存在的缺失鏈接或噪聲鏈接的影響。為解決該問題，本文利用圖拓撲與節點屬性的互補特性來提升局部聚類質量。為有效挖掘屬性信息，我們首先將LGC建模為雙向擴散分布(BDD)的估計問題，該模型專門用於捕捉含屬性節點的多跳關聯性。進一步提出LACA方法——一種高效且具備強局部性的LGC解決方案，在多個真實數據集上表現出卓越性能。其核心組件包括：(i)基於理論基礎的快速節點屬性預處理技術；(ii)具有嚴格理論保證和加速收斂特性的自適應向量擴散算法；(iii)高效的BDD近似三步驟方案。通過在8個真實數據集上與17種對比方法的實驗表明，LACA在真實局部簇標準下的結果質量優於所有對比方法，同時速度可提升數個數量級。代碼已開源：https://github.com/HaoranZ99/alac。

摘要

原文標題：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文標題：MAnycast重裝上陣：一個開放、快速、可靠且高效的日常任播普查工具
發布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分類：cs.NI
原文鏈接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一種廣泛採用的技術，通過將地址複製到多個位置來實現（例如）降低延遲和增強韌性。由於任播在現代互聯網中的關鍵作用，先前研究已引入工具來執行任播普查。首個工具iGreedy利用地理分散位置的延遲測量來映射任播部署；第二個工具MAnycast2則利用任播技術對其他任播網絡進行普查。MAnycast2的優勢在於速度——可在3小時內完成全網普查，但存在準確性和精確度問題。相反，iGreedy精度極高但速度較慢，且探測成本更高。本文針對這兩個系統的缺陷，提出了MAnycast Reloaded（MAnycastR）。我們以MAnycast2為基礎，徹底重構其測量流水線，新增分布式探測支持、額外協議（UDP、TCP和IPv6）支持，以及類似iGreedy的延遲測量功能。通過在含32個全球分布式節點的任播測試床上驗證，與外部任播生產部署對比，結合RIPE Atlas的廣泛延遲測量，並對檢測到的60%以上任播前綴進行運營商數據交叉核驗，證明MAnycastR具備高準確性與精確度。我們將持續提供每日MAnycastR普查數據，並以寬鬆開源協議發布工具源代碼。