WikiEdge:ArXiv速递/2025-03-26

摘要

原文标题：Orbital optimization of large active spaces via AI-accelerators
中文标题：基于AI加速器的大活性空间轨道优化
发布日期：2025-03-26 16:29:44+00:00
作者：Örs Legeza, Andor Menczer, Ádám Ganyecz, Miklós Antal Werner, Kornél Kapás, Jeff Hammond, Sotiris S. Xantheas, Martin Ganahl, Frank Neese
分类：physics.chem-ph, cond-mat.str-el
原文链接：http://arxiv.org/abs/2503.20700v1

中文摘要：我们提出了一种高效的轨道优化方法，该方法将高度GPU加速的自旋适应密度矩阵重整化群(DMRG)方法与ORCA程序包中实现的量子化学完全活性空间自洽场(CAS-SCF)方法相结合。利用最新一代Nvidia GPU硬件的计算能力，我们在包含数千个轨道中数百个电子活性空间尺寸的分子体系中，实现了前所未有的CAS尺寸轨道优化——最高达82个电子和82个轨道CAS(82,82)。针对NVIDIA DGX-A100和DGX-H100硬件，我们对多环芳烃和不同尺寸铁硫复合物构成的基准体系进行了详细的DMRG-SCF方法缩放和误差分析。我们的研究首次证明，在大键维度下进行高精度 DMRG计算对获得可靠收敛的CAS-SCF能量至关重要。对于更具挑战性的铁硫基准体系，我们还发现收敛CAS-SCF计算的优化轨道对DMRG参数的敏感性高于多环芳烃体系。这种能在数天内获得如此大尺寸活性空间的收敛CAS-SCF能量和轨道的能力，降低了将适当轨道纳入CAS或选择正确最小CAS的挑战，可能为解决强关联分子体系开辟全新途径。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重构动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会新陈代谢系统。SCN绝非静态存在，而是通过企业的进出和供应关系的重组持续演变。本研究利用独特数据集追踪了一个国家SCN中企业及其供需关系的时间演化。基于匈牙利2014至2022年按月申报的增值税数据，我们重建了包含711,248家企业和38,644,400条连接的整体经济网络，以企业级分辨率捕捉了整个经济体的每次重构事件。研究发现：每年约25%的企业退出SCN，同时28%的新企业加入；平均55%的年度供应关系会在次年消失；供应关系的半衰期为13个月。新连接以超偏好依附方式链接企业，概率满足$p(i)\propto k_i^{1.08}$（$k_i$表示企业$i$的连接数）。我们校准的简易统计网络生成模型成功复现了匈牙利主导SCN的典型特征，不仅能重现入/出度分布、同配性和聚类结构等局部特征，还能捕捉真实的系统性风险轮廓。该模型揭示了经济重连动态对量化系统韧性和估计冲击传导的关键作用。

摘要

原文标题：The Scalar Size of the Pion from Lattice QCD
中文标题：格点QCD中π介子的标量尺寸
发布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分类：hep-lat, hep-ph
原文链接：http://arxiv.org/abs/2503.20687v1

中文摘要：我们提出了一种系统误差完全受控的格点QCD计算，用于确定π介子标量形状因子及相关半径。计算结果基于17个规范系综的大规模数据集，这些系综采用$N_f=2+1$威尔逊Clover改进海夸克配置。这些系综覆盖了从$a=0.049\mathrm{fm}$到$a=0.086\mathrm{fm}$四种格点间距、$130-350\mathrm{MeV}$的π介子质量范围以及多种物理体积。通过对著名的夸克断开贡献的精确测定，我们首次在接近物理夸克质量的大尺寸精细系综上实现了形状因子前所未有的动量分辨率。研究采用了$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$范围内多种源汇间距，可靠地提取了零动量转移和非零动量转移下的相关基态矩阵元。这使得我们能够首次通过所得形状因子$Q^2$依赖性的$z$展开参数化（而非小动量转移下的简单线性近似）来获取标量半径。半径的物理外推采用三味NLO手征微扰理论，以三个低能常数（包括$L_4^r$的首个格点测定值）来参数化夸克质量依赖性。通过基于赤池信息准则的模型平均方法，我们系统评估了基态提取、形状因子参数化以及物理外推对最终结果的系统不确定性影响。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：基于属性图的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：给定图$G$和种子节点$v_s$，局部图聚类（LGC）的目标是在与$C_s$大小近似线性相关的时间内，识别出围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图的应用场景。然而，现有解决方案大多仅依赖图中节点的拓扑连接性，容易受到现实图数据中普遍存在的缺失或噪声链接的影响。为解决这一问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC建模为双向扩散分布（BDD）的估计问题，该模型专门用于捕捉含属性节点的多跳关联性。进一步提出LACA方法——一种高效且具备严格理论保证的LGC解决方案，其核心包括：(i) 基于理论基础的快速节点属性预处理技术；(ii) 具有加速收敛特性的自适应向量扩散算法；(iii) 高效的三步式BDD近似方案。通过在8个真实数据集上与17种方法的对比实验表明，LACA在真实局部簇的评估指标上全面优于现有方法，同时速度提升达数量级。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：High-Precision Ab Initio Radius Calculations of Boron Isotopes
中文标题：硼同位素高精度从头算半径计算
发布日期：2025-03-26 17:50:28+00:00
作者：Tobias Wolfgruber, Tobias Gesser, Marco Knöll, Pieter Maris, Robert Roth
分类：nucl-th
原文链接：http://arxiv.org/abs/2503.20764v1

中文摘要：我们采用手征有效场论中的多种现实相互作用对硼同位素半径进行了精确研究。通过从头算无核壳模型计算结合机器学习外推方法，我们获得了具有完整不确定性量化的半径预测值。进一步扩展到半径差异研究后，我们得以探究$^{8}$B中可能存在的质子晕现象，并提供了与同位素位移直接相关的预测值——该位移可通过实验进行精确测量。

摘要

原文标题：Search for events with one displaced vertex from long-lived neutral particles decaying into hadronic jets in the ATLAS muon spectrometer in $pp$ collisions at $\sqrt{s}=13$ TeV
中文标题：在$\sqrt{s}=13$ TeV质子-质子对撞中利用ATLASμ子谱仪寻找长寿命中性粒子衰变为强子喷注的单位移顶点事例
发布日期：2025-03-26 11:21:36+00:00
作者：ATLAS Collaboration
分类：hep-ex
原文链接：http://arxiv.org/abs/2503.20445v1

中文摘要：摘要：本文报道了利用大型强子对撞机 ATLAS探测器在2015-2018年收集的140 fb$^{-1}$、质心能量$\sqrt{s}=13$ TeV的质子-质子对撞数据，对长寿命中性粒子衰变为强子喷注并在μ子谱仪中产生位移顶点（距主相互作用顶点3-14米）的事件进行搜寻。观测到的事件数与预期本底一致，并对若干基准信号模型给出了限制。研究考虑了标量门户模型和希格斯玻色子门户重子生成模型，并采用专用分析道针对Z玻色子伴随产生的长寿命粒子（包括类轴子粒子和暗光子模型）进行探测。对于希格斯玻色子模型，在95%置信水平下排除了长寿命粒子固有衰变长度在5厘米至40米范围内、分支比高于1%的情况。对于所研究的避光类轴子粒子模型，本次搜寻对固有衰变长度大于$\mathcal{O}(10)$厘米的情况给出了迄今最强的限制。

摘要

原文标题：Ion beam treatment of thick polystyrene films
中文标题：厚聚苯乙烯薄膜的离子束处理
发布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分类：physics.chem-ph
原文链接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋涂厚度为78 nm至1.3 μm的聚苯乙烯薄膜经20 keV氮离子束处理后，椭圆偏振测量和FTIR光谱显示表面改性层与离子在聚合物中的穿透深度（约70 nm）相符。然而，深层洗涤及后续测试表明，薄改性层中形成的自由基会迁移至体层，导致深层聚苯乙烯发生一系列化学结构变化。因此，尽管离子在聚苯乙烯膜中的穿透深度较浅，但整个薄膜的改性深度远超过离子投射范围。这表明离子束处理仅能条件性地视为表面改性方法，必须考虑自由基反应及其向聚合物深层迁移的可能性。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数极大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：我们研究一维高斯位置混合模型的非参数最大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定n个数据点时，该估计量总是返回最多含n个分量的混合模型；而近期(Wu-Polyanskiy, 2020)对次高斯数据给出了严格的$O(\log n)$界。本文研究$\widehat{\pi}$的计算特性：提出一种算法，当$\varepsilon>0$足够小时，可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算Wasserstein距离下的$\varepsilon$近似解，其中$K$与数据相关但与$\varepsilon$无关，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$是$\widehat\pi$的原子数。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$来自具有(相对于勒贝格测度的)密度的概率分布时，这些保证几乎必然成立。我们还证明：当$k\leq \sqrt{n}/3$时，限定为k原子型的$\widehat\pi$条件分布在相关$2k-1$维参数空间上存在密度，且EM算法几乎必然具有局部线性收敛性。关键工具之一是非退化曲线的经典傅里叶分析估计。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子间势的聚合物电解质膜质子传输大规模长时原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势能（MLIPs）作为一种能够实现大规模、长时间原子模拟的方法备受关注，同时保持与基于密度泛函理论（DFT）和从头算波函数理论的电子结构计算相当的精度。然而，基于MLIP的分子动力学（MD）模拟面临的一个挑战是，与使用传统经典势能的模拟相比，其稳定性较低。分析高度异质系统或非晶材料通常需要大规模和长时间的模拟，因此需要开发能够实现稳定MD模拟的鲁棒性MLIPs。在本研究中，我们利用神经网络势能（NNP）生成器，构建了一个NNP模型，该模型能够对全氟离子交换膜（Nafion）在不同水合水平下进行大规模、长时间的MD模拟。通过主动学习循环迭代扩展数据集，我们成功构建了一个鲁棒的深度势能（DP）模型。具体而言，通过将非平衡DPMD模拟采样的非平衡结构与结合最小原子间距离的三维结构特征空间中的结构筛选相结合，可以显著增强DP模型的鲁棒性，从而实现对约10,000至20,000个原子的大型Nafion系统进行长达31 ns的稳定MD模拟。采用所开发的DP模型进行的MD模拟得到的氢原子自扩散系数，在广泛的水合水平范围内，与先前较小系统的从头算MD模拟相比，更接近实验值。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：开放、快速、可靠且高效的每日任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过将地址复制到多个位置来实现（例如降低延迟和增强韧性）。由于任播在现代互联网中的关键作用，先前研究已开发了执行任播普查的工具。首个工具iGreedy利用地理分散位置的延迟测量来绘制任播部署图；第二个工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查，但存在准确性和精确性问题。相反，iGreedy精度极高但速度较慢，且探测成本更高。本文针对这两个系统的缺陷，提出了MAnycast Reloaded（MAnycastR）。我们以MAnycast2为基础，彻底重构其测量流水线，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持，以及类似iGreedy的延迟测量功能。通过在含32个全球分布式节点的任播测试平台验证，与真实任播生产部署对比，并利用RIPE Atlas进行大规模延迟测量，同时对照运营商提供的真实数据交叉核验超过60%的检测任播前缀，证明MAnycastR具备高准确性和精确性。我们将持续提供每日MAnycastR普查数据，并以宽松开源协议发布工具源代码。

摘要

原文标题：Scalability Evaluation of HPC Multi-GPU Training for ECG-based LLMs
中文标题：基于心电图的大语言模型多GPU训练的可扩展性评估
发布日期：2025-03-26 22:48:17+00:00
作者：Dimitar Mileski, Nikola Petrovski, Marjan Gusev
分类：cs.DC, C.4; I.6
原文链接：http://arxiv.org/abs/2503.21033v1

中文摘要：摘要：训练大型语言模型需要大量计算处理，这依赖于众多高性能计算资源。本研究比较了多节点与多GPU环境在心电图大型语言模型训练中的表现。详细梳理了当前分布式深度学习框架在多节点和多GPU配置下的应用方案，包括Uber的Horovod、微软的DeepSpeed，以及PyTorch和TensorFlow的内置分布式功能。针对不同数据集配置，我们对比了多种多GPU方案，独立利用多个HPC节点，重点关注可扩展性、加速比、效率和开销。分析采用配备SLURM调度系统、Apptainer（Singularity）容器、CUDA、PyTorch和Shell脚本的HPC基础设施来支持训练流程自动化。实验结果显示GPU数量扩展时获得次线性加速比，双GPU达1.6倍，四GPU达1.9倍。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重构动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成了任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会新陈代谢系统。供应链网络绝非静态存在，而是通过企业的进入退出与供应关系的重组持续演变。本文利用独特数据集研究了一个国家供应链网络中企业及其供应商-采购商关系的时序演化。基于匈牙利2014至2022年按月申报的增值税数据，我们重建了包含711,248家企业和38,644,400条连接的整体经济网络，以企业级分辨率捕捉了整个经济体几乎所有的重构事件。研究发现：每年约25%的企业退出供应链网络，同时28%的新企业进入；平均而言，当年存在的供应链接中有55%会在次年消失；供应链接的半衰期为13个月。新链接以超偏好依附概率$p(i)\propto k_i^{1.08}$（$k_i$表示企业$i$的供应连接数）附着于企业。我们校准了一个能复现匈牙利主导供应链网络典型特征的简易统计网络生成模型，该模型不仅再现了入/出度分布、同配性和聚类结构等局部网络特征，还捕捉到真实的系统性风险特征。最后探讨了经济重连动态对量化系统韧性和估计冲击传导的关键作用。

摘要

原文标题：The Scalar Size of the Pion from Lattice QCD
中文标题：格点QCD计算的π介子标量尺寸
发布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分类：hep-lat, hep-ph
原文链接：http://arxiv.org/abs/2503.20687v1

中文摘要：我们提出了一种系统误差完全受控的格点QCD计算，用于确定π介子标量形状因子及相关半径。计算结果基于17个规范场组态的大规模集合，采用$N_f=2+1$威尔逊-克拉沃尔改进海夸克。这些组态覆盖了从$a=0.049\mathrm{fm}$到$a=0.086\mathrm{fm}$四种格距、$130-350\mathrm{MeV}$的π介子质量范围以及多种物理体积。通过精确计算著名的夸克断开贡献，我们在接近物理夸克质量的大尺寸精细组态上，实现了形状因子前所未有的动量分辨率。采用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$的大范围源汇间距，可靠地提取了零动量转移和非零动量转移下的相关基态矩阵元。这使得我们首次能够通过所得形状因子$Q^2$依赖性的$z$展开参数化（而非小动量转移下的简单线性近似）来获取标量半径。使用三味NLO手征微扰理论对半径进行物理外推，通过三个低能常数（包括$L_4^r$的首次格点测定）参数化夸克质量依赖性。基于赤池信息准则的模型平均方法，我们系统评估了基态提取、形状因子参数化以及物理外推对最终结果的系统不确定性。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：基于属性图的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：给定图$G$和种子节点$v_s$，局部图聚类(LGC)的目标是在与$C_s$大小大致成线性关系的时间内，识别出围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图的应用场景。然而，现有解决方案大多仅依赖图中节点的拓扑连接关系，容易受到现实图数据中普遍存在的缺失链接或噪声链接的影响。为解决这一问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC问题建模为双向扩散分布(BDD)的估计问题，该模型专门用于捕捉带属性节点的多跳关联性。进一步提出LACA方法——一种高效且具备严格理论保证的LGC解决方案，其核心组件包括：(i)快速且理论完备的节点属性预处理技术；(ii)具有理论保证和加速收敛特性的自适应向量扩散算法；(iii)有效的BDD近似三步骤方案。通过在8个真实数据集上与17种对比方法的实验表明，LACA在真实局部簇的评估指标上全面优于所有对比方法，同时速度提升达数量级。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：Orbital optimization of large active spaces via AI-accelerators
中文标题：基于AI加速器的大活性空间轨道优化
发布日期：2025-03-26 16:29:44+00:00
作者：Örs Legeza, Andor Menczer, Ádám Ganyecz, Miklós Antal Werner, Kornél Kapás, Jeff Hammond, Sotiris S. Xantheas, Martin Ganahl, Frank Neese
分类：physics.chem-ph, cond-mat.str-el
原文链接：http://arxiv.org/abs/2503.20700v1

中文摘要：我们提出了一种高效的轨道优化方法，该方法将高度GPU加速的自旋适应密度矩阵重整化群(DMRG)方法与ORCA程序包中实现的量子化学完全活性空间自洽场(CAS-SCF)方法相结合。利用最新一代Nvidia GPU硬件的计算能力，我们在包含数千个轨道中数百个电子活性空间尺寸的分子体系中，实现了前所未有的CAS尺寸轨道优化——高达82个电子和82个轨道CAS(82,82)。针对NVIDIA DGX-A100和DGX-H100硬件，我们对多环芳烃和不同尺寸铁硫配合物基准体系进行了详细的DMRG-SCF方法扩展性和误差分析。我们的研究首次证明，在大键维度下进行高精度 DMRG计算对获得可靠收敛的CAS-SCF能量至关重要。对于更具挑战性的铁硫基准体系，我们还发现收敛CAS-SCF计算的优化轨道对DMRG参数的敏感性高于多环芳烃体系。这种能在数天内获得如此大尺寸活性空间的收敛CAS-SCF能量和轨道的能力，降低了将适当轨道纳入CAS或选择正确最小CAS的挑战，可能为处理强关联分子体系开辟全新途径。

摘要

原文标题：Ion beam treatment of thick polystyrene films
中文标题：厚聚苯乙烯薄膜的离子束处理
发布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分类：physics.chem-ph
原文链接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋涂厚度从78纳米至1.3微米不等的聚苯乙烯薄膜，经20 keV氮离子束处理后，椭偏仪测量和傅里叶变换红外光谱显示表面改性层与离子在聚合物中的穿透深度（约70纳米）相符。然而，深层洗涤及后续测试表明，薄改性层中形成的自由基会迁移至本体层，导致深层聚苯乙烯化学结构发生系列变化。因此，尽管离子在聚苯乙烯膜中的穿透深度有限，整个薄膜的改性深度却远超过离子投影射程。这表明离子束处理仅能条件性地视为表面改性方法，必须考虑自由基反应及其向聚合物深层迁移的可能性。

摘要

原文标题：Dynamic-OCT simulation framework based on mathematical models of intratissue dynamics, image formation, and measurement noise
中文标题：基于组织内动态、成像形成和测量噪声数学模型的动态OCT仿真框架
发布日期：2025-03-26 10:31:16+00:00
作者：Yuanke Feng, Shumpei Fujimura, Yiheng Lim, Thitiya Seesan, Rion Morishita, Ibrahim Abd El-Sadek, Pradipta Mukherjee, Shuichi Makita, Yoshiaki Yasuno
分类：physics.med-ph, physics.optics
原文链接：http://arxiv.org/abs/2503.20407v1

中文摘要：动态光学相干断层扫描（DOCT）通过捕捉由细胞内和组织内运动引起的时间 OCT信号变化，实现了无标记功能成像。然而，DOCT信号与其背后样本运动之间的关系仍不明确。本文提出一个综合DOCT仿真框架，该框架整合了细胞内/组织内运动的数学模型、两种从运动散射体模型生成OCT信号时间序列的OCT信号发生器类型，以及代表性DOCT算法。详细描述了该框架的理论与算法，并通过数值研究验证了其实用性。该框架已开源，将增进对DOCT的理解和应用价值。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数最大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：我们研究一维高斯位置混合模型的非参数最大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定n个数据点时，该估计量始终返回最多含n个混合模型的分量；而近期(Wu-Polyanskiy, 2020)对次高斯数据给出了严格的$O(\log n)$界。本文研究$\widehat{\pi}$的计算特性：针对足够小的$\varepsilon>0$，我们提出算法可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算Wasserstein距离下的$\varepsilon$近似解，其中$K$依赖数据但独立于$\varepsilon$，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子数量。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$来自具有Lebesgue测度密度的独立分布时，这些保证几乎必然成立。同时证明：当$k\leq \sqrt{n}/3$时，限定为k原子结构的$\widehat\pi$条件分布在相应$2k-1$维参数空间上存在密度，且EM算法几乎必然具有局部线性收敛性。关键工具之一是非退化曲线的经典傅里叶分析估计。

摘要

原文标题：Search for events with one displaced vertex from long-lived neutral particles decaying into hadronic jets in the ATLAS muon spectrometer in $pp$ collisions at $\sqrt{s}=13$ TeV
中文标题：在$\sqrt{s}=13$ TeV的$pp$对撞中ATLASμ子谱仪内长寿命中性粒子衰变为强子喷注产生单位移顶点的事例搜寻
发布日期：2025-03-26 11:21:36+00:00
作者：ATLAS Collaboration
分类：hep-ex
原文链接：http://arxiv.org/abs/2503.20445v1

中文摘要：摘要：本文报道了利用ATLAS探测器在大型强子对撞机上收集的数据（2015-2018年记录的140 fb$^{-1}$、$\sqrt{s} = 13$ TeV质子-质子对撞数据）对长寿命中性粒子衰变为强子喷注产生单位移顶点事件的搜寻。该研究采用顶点重建技术，针对μ子谱仪中距主相互作用顶点3米至14米处衰变的长寿命粒子。观测事件数与预期本底相符，并确定了若干基准信号模型的限制。研究考虑了标量门户模型和希格斯玻色子门户重子生成模型，同时设立专用分析通道针对Z玻色子伴随的长寿命粒子产生过程（包括类轴子粒子和暗光子模型）。对于希格斯玻色子模型，在95%置信水平下排除了长寿命粒子固有衰变长度5厘米至40米范围内分支比高于1%的情况。对于所研究的避光类轴子粒子模型，本次搜寻对固有衰变长度大于$\mathcal{O}(10)$厘米的情况给出了迄今最强的限制。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势（MLIPs）作为一种能够实现大规模、长时间原子尺度模拟的方法，同时保持与基于密度泛函理论（DFT）和从头算波函数理论的电子结构计算相当的精度，引起了广泛关注。然而，基于MLIP的分子动力学（MD）模拟面临的挑战是其稳定性低于使用传统经典势的模拟。分析高度异质体系或非晶材料通常需要大规模和长时间的模拟，因此需要开发能够实现稳定MD模拟的鲁棒MLIP。在本研究中，我们利用神经网络势（NNP）生成器，构建了一个NNP模型，能够在广泛水合水平范围内对全氟离聚物膜（Nafion）进行大规模、长时间的MD模拟。通过主动学习循环迭代扩展数据集，我们成功建立了鲁棒的深度势（DP）模型。具体而言，通过将非平衡DPMD模拟采样的非平衡结构与结合最小原子间距的三维结构特征空间中的结构筛选相结合，可以显著增强DP模型的鲁棒性，从而实现对约10,000至20,000个原子的大型Nafion体系进行长达31 ns的稳定MD模拟。采用所开发DP模型的MD模拟获得的氢原子自扩散系数，在广泛水合水平范围内与实验值更为接近，优于先前对小体系进行的从头算MD模拟结果。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：一个开放、快速、可靠且高效的每日任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过在多位置复制地址来实现降低延迟和增强韧性等目标。鉴于任播在现代互联网中的关键作用，先前研究已开发了执行任播普查的工具。首个工具iGreedy利用地理分散节点的延迟测量来绘制任播部署图；第二个工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查，但存在准确性和精确性问题。相反，iGreedy精度极高但速度较慢，且探测成本更高。本文针对这两个系统的缺陷提出了MAnycast Reloaded（MAnycastR）。以MAnycast2为基础，我们彻底重构了其测量流水线，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持，以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR，与外部任播生产部署进行对比，通过RIPE Atlas进行广泛延迟测量，并对检测到的60%以上任播前缀进行运营商数据交叉核验。结果表明MAnycastR实现了高准确性与精确度。我们将持续提供每日MAnycastR普查数据，并以宽松开源协议发布工具源代码。

摘要

原文标题：High-Performance Computational Magnetohydrodynamics with Python
中文标题：基于Python的高性能磁流体力学计算
发布日期：2025-03-26 18:16:17+00:00
作者：Chris Bard, John Dorelli
分类：physics.plasm-ph, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20899v1

中文摘要：我们推出AGATE模拟代码，这是一个基于Python开发的框架，主要用于求解磁流体动力学(MHD)方程，同时保持对其他方程组的适应性。该代码采用模块化、面向对象的架构，将接口规范与数值实现分离，允许用户自定义数值方法和物理模型。基于Godunov型有限体积格式构建的AGATE目前支持理想、霍尔及Chew-Goldberger-Low(CGL)三种MHD方程，并提供从Numpy到支持NVIDIA CUDA的GPU计算等多种加速选项。性能测试表明我们的GPU实现相比CPU版本可获得40-60倍的加速。通过标准基准测试的全面验证，证实了该代码能准确再现不同MHD体系下的线性和非线性现象。这种兼具模块化、高性能和可扩展性的特点，使得AGATE适用于从快速原型开发到生产模拟、从数值算法开发到物理教学等多种应用场景。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重连动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成了任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会新陈代谢系统。SCN绝非静态存在，而是通过企业的进出与供应关系的重组持续演变。本研究利用独特数据集追踪了一个国家供应链网络中企业及其供需关系的时序演化。基于匈牙利2014至2022年按月申报的增值税数据，我们重建了包含711,248家企业和38,644,400条连接的整体经济网络，实现了企业级分辨率下完整经济体系重组事件的全面覆盖。研究发现：每年约25%的企业退出SCN，同时28%的新企业加入；平均55%的年度供应关系会在次年消失；供应关系的半衰期为13个月。新连接以超偏好依附方式链接企业，概率满足$p(i)\propto k_i^{1.08}$（$k_i$表示企业i的供应连接数）。我们校准的简易统计网络生成模型成功复现了匈牙利主导SCN的典型特征，不仅匹配入/出度分布、同配性和聚类结构等局部特征，还能捕捉真实的系统性风险轮廓。该模型揭示了经济网络重连动态对量化系统韧性和评估冲击传导的关键作用。

摘要

原文标题：The Scalar Size of the Pion from Lattice QCD
中文标题：格点QCD中π介子的标量大小
发布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分类：hep-lat, hep-ph
原文链接：http://arxiv.org/abs/2503.20687v1

中文摘要：我们提出了一种系统误差完全受控的格点QCD计算，用于确定π介子标量形状因子及相关半径。计算结果基于17个规范场组态的大规模集合，采用$N_f=2+1$威尔逊-克拉沃尔改进海夸克。这些组态覆盖了从$a=0.049\mathrm{fm}$到$a=0.086\mathrm{fm}$四种格距、$130-350\mathrm{MeV}$的π介子质量范围以及多种物理体积。通过对著名的夸克断开贡献的精确测定，我们首次在接近物理夸克质量的大尺寸精细组态上实现了形状因子前所未有的动量分辨率。采用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$的大范围源汇间距，可靠地提取了零动量转移和非零动量转移下的相关基态矩阵元。这使得我们首次能够通过所得形状因子$Q^2$依赖性的$z$展开参数化（而非小动量转移下的简单线性近似）来获取标量半径。半径的物理外推采用三味NLO手征微扰理论，以三个低能常数（包括$L_4^r$的首次格点测定结果）参数化夸克质量依赖性。通过基于赤池信息准则的模型平均方法，系统评估了基态提取、形状因子参数化以及物理外推对最终结果的系统不确定性影响。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：基于属性图的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：给定图$G$和种子节点$v_s$，局部图聚类（LGC）的目标是在与$C_s$大小大致成线性关系的时间内，识别出围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图的应用场景。然而现有方案大多仅依赖图中节点的拓扑连接性，容易受到现实图数据中普遍存在的缺失或噪声链接的影响。为解决该问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC建模为双向扩散分布（BDD）的估计问题，该模型专门用于捕捉含属性节点的多跳关联性。进一步提出LACA方法——一种高效且具备强局部性的LGC解决方案，在多个真实数据集上表现出卓越性能。其核心组件包括：(i) 基于理论基础的快速节点属性预处理技术；(ii) 具有严格理论保证和加速收敛特性的自适应向量扩散算法；(iii) 高效的三步式BDD近似方案。通过在8个真实数据集上与17种对比方法的实验表明，LACA在真实局部簇标准下的结果质量优于所有对比方法，同时速度可提升数个数量级。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：Scalability Evaluation of HPC Multi-GPU Training for ECG-based LLMs
中文标题：基于心电图的大语言模型多GPU训练的可扩展性评估
发布日期：2025-03-26 22:48:17+00:00
作者：Dimitar Mileski, Nikola Petrovski, Marjan Gusev
分类：cs.DC, C.4; I.6
原文链接：http://arxiv.org/abs/2503.21033v1

中文摘要：摘要：训练大型语言模型需要大量计算处理，这得益于众多高性能计算资源的支持。本研究比较了多节点与多GPU环境在心电图大型语言模型训练中的表现。详细梳理了当前分布式深度学习框架在多节点和多GPU配置下的应用方案，包括Uber的Horovod、微软的DeepSpeed以及PyTorch和TensorFlow的内置分布式功能。针对不同数据集配置，我们对比了多种多GPU方案，独立利用多个HPC节点，重点关注可扩展性、加速比、效率和开销。分析过程采用配备SLURM调度系统、Apptainer（Singularity）容器、CUDA、PyTorch和shell脚本的HPC基础设施来支持训练工作流和自动化。实验结果显示GPU数量扩展时获得次线性加速比，双GPU达1.6倍，四GPU达1.9倍。

摘要

原文标题：Ion beam treatment of thick polystyrene films
中文标题：厚聚苯乙烯薄膜的离子束处理
发布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分类：physics.chem-ph
原文链接：http://arxiv.org/abs/2503.20359v1

中文摘要：在硅片上旋涂厚度从78纳米至1.3微米不等的聚苯乙烯薄膜，经20 keV 氮离子束处理后，椭偏仪测量和傅里叶变换红外光谱显示表面改性层深度与离子在聚合物中的穿透深度（约70纳米）相符。然而，深层洗涤及后续测试表明：薄改性层中形成的自由基会迁移至体层，导致聚苯乙烯深层化学结构发生系列变化。因此，尽管离子在聚苯乙烯膜中的穿透深度较浅，但整个薄膜的改性深度远超离子投影射程。这表明离子束处理仅能条件性地视为表面改性方法，必须考虑自由基反应及其向聚合物深层迁移的可能性。

摘要

原文标题：Orbital optimization of large active spaces via AI-accelerators
中文标题：基于AI加速器的大活性空间轨道优化
发布日期：2025-03-26 16:29:44+00:00
作者：Örs Legeza, Andor Menczer, Ádám Ganyecz, Miklós Antal Werner, Kornél Kapás, Jeff Hammond, Sotiris S. Xantheas, Martin Ganahl, Frank Neese
分类：physics.chem-ph, cond-mat.str-el
原文链接：http://arxiv.org/abs/2503.20700v1

中文摘要：我们提出了一种高效的轨道优化方法，该方法将高度GPU加速的自旋适应密度矩阵重整化群(DMRG)方法与ORCA程序包中实现的量子化学完全活性空间自洽场(CAS-SCF)方法相结合。利用最新一代Nvidia GPU硬件的计算能力，我们在包含数千个轨道中数百个电子活性空间尺寸的分子体系中，实现了前所未有的CAS尺寸轨道优化——最高达82个电子和82个轨道CAS(82,82)。针对NVIDIA DGX-A100和DGX-H100硬件，我们对多环芳烃和不同尺寸铁硫复合物构成的基准体系进行了详细的DMRG-SCF方法缩放和误差分析。我们的研究首次证明，在大键维度下进行高精度 DMRG计算对于获得可靠收敛的CAS-SCF能量至关重要。对于更具挑战性的铁硫基准体系，我们还发现收敛CAS-SCF计算的优化轨道对DMRG参数的敏感性高于多环芳烃体系。这种能在数天内获得如此大尺寸活性空间的收敛CAS-SCF能量和轨道的能力，降低了将适当轨道纳入CAS或选择正确最小CAS的挑战，可能为处理强关联分子体系开辟全新途径。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数极大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：我们研究一维高斯位置混合模型的非参数极大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定n个数据点时，该估计量总是返回最多含n个分量的混合模型；而近期(Wu-Polyanskiy, 2020)对次高斯数据给出了精确的$O(\log n)$界。本文研究$\widehat{\pi}$的计算特性：我们提出一种算法，当$\varepsilon>0$足够小时，可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算得到$\widehat\pi$的Wasserstein距离$\varepsilon$-近似解。其中$K$与数据相关但独立于$\varepsilon$，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子数量。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$中的点独立采样自具有Lebesgue测度密度的概率分布时，这些保证几乎必然成立。我们还证明：当$\widehat\pi$被约束为k原子分布时，其在$2k-1$维参数空间上存在密度（对所有$k\leq \sqrt{n}/3$成立），且EM算法几乎必然具有局部线性收敛性。关键工具之一是对非退化曲线的经典傅里叶分析估计。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子间势的聚合物电解质膜质子传输大规模长时原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势（MLIPs）作为一种能够实现大规模、长时间原子尺度模拟的方法备受关注，同时保持与基于密度泛函理论（DFT）和从头算波函数理论的电子结构计算相当的精度。然而，基于MLIP的分子动力学（MD）模拟面临的一个挑战是，与传统经典势函数相比其稳定性较低。分析高度异质体系或非晶材料通常需要大规模和长时间的模拟，因此需要开发能够实现稳定MD模拟的鲁棒性 MLIPs。在本研究中，我们利用自研的神经网络势（NNP）生成器，构建了一个NNP模型，能够对全氟离聚物膜（Nafion）在不同水合水平下进行大规模、长时间的MD模拟。通过主动学习循环迭代扩展数据集，我们成功建立了鲁棒的深度势（DP）模型。具体而言，通过将非平衡 DPMD模拟采样的非平衡结构与结合最小原子间距的三维结构特征空间中的结构筛选相结合，可显著提升DP模型的鲁棒性，从而实现对约10,000至20,000个原子的大型Nafion体系进行长达31 ns的稳定MD模拟。采用所开发DP模型的MD模拟获得的氢原子自扩散系数，在广泛水合水平范围内比先前小体系从头算 MD模拟结果更接近实验值。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：开放、快速、可靠且高效的每日任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过在多位置复制地址来实现降低延迟、增强韧性等目标。鉴于任播在现代互联网中的关键作用，先前研究已开发了多种任播普查工具。首款工具iGreedy通过地理分散的延迟测量来绘制任播部署图；第二款工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——仅需3小时即可完成全网普查，但存在准确性和精确度问题。反之，iGreedy精度极高但速度较慢，且探测成本更高。本文针对这两个系统的缺陷，提出了升级版MAnycast Reloaded（MAnycastR）。以MAnycast2为基础，我们彻底重构了其测量管道，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持以及类似iGreedy的延迟测量功能。通过在含32个全球分布式节点的任播测试床上验证，与真实任播生产部署对比，并利用RIPE Atlas进行大规模延迟测量，同时对照运营商提供的真实数据核验了60%以上检测到的任播前缀，证明MAnycastR具备高准确性与精确度。我们将持续提供每日更新的MAnycastR普查数据，并以宽松开源协议发布工具源代码。

摘要

原文标题：Flow of a two-dimensional liquid foam: Impact of surfactant type and boundary conditions
中文标题：二维液体泡沫的流动：表面活性剂类型和边界条件的影响
发布日期：2025-03-26 16:44:40+00:00
作者：Farshad Nazari, Andrei Potanin, Hadi Mohammadigoushki
分类：cond-mat.soft, physics.flu-dyn
原文链接：http://arxiv.org/abs/2503.20710v1

中文摘要：本研究通过实验探究了二维单分散水基泡沫在平行板间剪切时的流变与流动行为，采用自制光流变仪（配备光滑/粗糙壁面）进行测试。使用两种市售洗涤剂（Foam 1和Foam 2）制备泡沫，保持气泡尺寸和液相分数一致。线性粘弹性结果表明：无论边界条件如何，Foam 1始终表现出比Foam 2更高的弹性模量和损耗模量，且粗糙壁面会进一步强化两种泡沫的模量。此外，Foam 1的粘弹性弛豫频率较低，表明其界面流动性较弱。在非线性区域观察到显著差异：光滑边界条件下，Foam 2呈现屈服应力特性而Foam 1未出现，尽管后者具有更高的粘性应力。Foam 1的粘性应力与毛细数呈标度关系，而Foam 2的标度行为依边界条件（光滑/粗糙壁面）呈现差异。这些流变行为差异源于表面活性剂化学性质不同导致的界面流动性差异，其中Foam 1的界面流动性低于Foam 2。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重连动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会新陈代谢系统。SCN绝非静态存在，而是通过企业的进出与供应关系的重组持续演变。本文利用独特数据集研究了一个国家SCN中企业及其供应商-客户关系的时间演化。基于匈牙利2014至2022年每月报告的增值税数据，我们重建了包含711,248家企业和38,644,400条连接的完整经济网络，以企业级分辨率覆盖了整个经济体的几乎所有重构事件。研究发现：每年约25%的企业退出SCN，同时28%的新企业加入；平均55%的现存供应链接会在次年消失；供应链接的半衰期为13个月。新链接以超偏好依附方式连接企业，概率满足$p(i)\propto k_i^{1.08}$（$k_i$表示企业$i$的供应连接数）。我们校准了一个能复现匈牙利主导SCN典型特征的简单统计网络生成模型，该模型不仅再现了入/出度分布、同配性和聚类结构等局部网络特征，还捕捉了真实的系统性风险轮廓。最后讨论了当前模型如何通过经济重连动态来量化系统韧性及评估冲击传导。

摘要

原文标题：The Scalar Size of the Pion from Lattice QCD
中文标题：π介子标量尺寸的格点QCD研究
发布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分类：hep-lat, hep-ph
原文链接：http://arxiv.org/abs/2503.20687v1

中文摘要：我们提出了一种系统误差完全受控的格点QCD计算，用于确定π介子标量形状因子及相关半径。计算结果基于17个规范系综的大规模数据集，这些系综采用$N_f=2+1$威尔逊Clover改进海夸克配置，涵盖$0.049\mathrm{fm}$至$0.086\mathrm{fm}$四种格距、$130-350\mathrm{MeV}$的π介子质量范围及多种物理体积。通过对棘手夸克断开贡献的精确测定，我们在接近物理夸克质量的大尺寸精细系综上实现了形状因子前所未有的动量分辨率。采用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$的大范围源汇间距，可靠地提取了零动量转移与非零动量转移下的基态矩阵元。这使得我们首次能通过所得形状因子$Q^2$依赖性的$z$展开参数化（而非小动量转移下的简单线性近似）获取标量半径。物理外推采用三味NLO手征微扰理论，以三个低能常数（包括$L_4^r$的首个格点测定值）参数化夸克质量依赖性。通过基于赤池信息准则的模型平均方法，系统评估了基态提取、形状因子参数化及物理外推对最终结果的系统不确定性。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：基于属性图的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：给定图$G$和种子节点$v_s$，局部图聚类（LGC）的目标是在与$C_s$大小大致成线性关系的时间内，识别出围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图的应用场景。然而，现有解决方案大多仅依赖图中节点的拓扑连接关系，容易受到现实图数据中普遍存在的缺失或噪声链接的影响。为解决该问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC建模为双向扩散分布（BDD）的估计问题，该模型专门用于捕捉带属性节点的多跳关联性。进一步提出LACA方法——一种高效且具备严格理论保证的LGC方案，其核心组件包括：(i) 基于理论基础的快速节点属性预处理技术；(ii) 具有自适应扩散能力和加速收敛特性的向量传播算法；(iii) 高效的三步式BDD近似策略。在8个真实数据集上与17种基线方法的对比实验表明，LACA在真实局部簇的评估指标上全面优于所有对比方法，同时速度提升达数量级。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：Scalability Evaluation of HPC Multi-GPU Training for ECG-based LLMs
中文标题：基于心电图的大语言模型多GPU训练的可扩展性评估
发布日期：2025-03-26 22:48:17+00:00
作者：Dimitar Mileski, Nikola Petrovski, Marjan Gusev
分类：cs.DC, C.4; I.6
原文链接：http://arxiv.org/abs/2503.21033v1

中文摘要：摘要：训练大型语言模型需要大量计算处理，这依赖于众多高性能计算资源。本研究比较了多节点与多GPU环境在心电图大型语言模型训练中的表现。详细梳理了当前分布式深度学习框架在多节点和多GPU配置下的应用方案，包括Uber的Horovod、微软的DeepSpeed，以及PyTorch和TensorFlow的内置分布式功能。针对不同数据集配置，我们对比了多种多GPU方案，独立利用多个HPC节点，重点关注可扩展性、加速比、效率和开销。分析过程采用配备SLURM调度系统、Apptainer（Singularity）容器、CUDA、PyTorch和shell脚本的HPC基础设施来支持训练工作流和自动化。实验结果显示GPU数量扩展时获得次线性加速比：双GPU达1.6倍，四GPU达1.9倍。

摘要

原文标题：Ion beam treatment of thick polystyrene films
中文标题：厚聚苯乙烯薄膜的离子束处理
发布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分类：physics.chem-ph
原文链接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋涂厚度从78纳米至1.3微米不等的聚苯乙烯薄膜，经20 keV氮离子束处理后，椭偏仪测量和傅里叶变换红外光谱显示表面改性层深度与离子在聚合物中的穿透深度（约70纳米）相符。然而，深层洗涤及后续测试表明，薄改性层中形成的自由基会迁移至本体层，导致深层聚苯乙烯化学结构发生系列变化。因此，尽管离子在聚苯乙烯薄膜中的穿透深度较浅，但整个薄膜的改性深度远超离子投射范围。这表明离子束处理仅能条件性地视为表面改性方法，必须考虑自由基反应及其向聚合物深层迁移的可能性。

摘要

原文标题：Quantum decoherence in the Caldeira-Leggett model by the real-time path integral on a computer
中文标题：计算机实时路径积分下的Caldeira-Leggett模型量子退相干
发布日期：2025-03-26 16:29:38+00:00
作者：Jun Nishimura, Hiromasa Watanabe
分类：hep-lat, cond-mat.stat-mech, hep-th, nucl-th, quant-ph
原文链接：http://arxiv.org/abs/2503.20699v1

中文摘要：摘要：我们提出了一种基于实时路径积分形式的第一性原理计算方法，用于研究开放系统，该方法在计算机上同时处理环境和我们感兴趣的系统。通过采用过去十年发展起来的Lefschetz thimble方法，可以普遍克服蒙特卡洛方法应用中的符号问题。本文重点研究Caldeira-Leggett模型——该模型尤其以描述量子退相干现象而闻名。在此模型中，由于典型初始条件下路径积分呈现高斯特性，计算过程得到极大简化。通过求解具有庞大但稀疏系数矩阵的线性方程，可确定唯一且复杂的相关鞍点，并能解析完成Lefschetz thimble上的积分。由此，我们在无需假设或近似的情况下，获得了长时间演化后对环境大量谐振子进行迹运算得到的约化密度矩阵。特别地，我们在特定参数范围内验证了退相干时间与耦合常数及温度的关系——这一关系此前已通过主方程预测得出。

摘要

原文标题：Orbital optimization of large active spaces via AI-accelerators
中文标题：基于AI加速器的大活性空间轨道优化
发布日期：2025-03-26 16:29:44+00:00
作者：Örs Legeza, Andor Menczer, Ádám Ganyecz, Miklós Antal Werner, Kornél Kapás, Jeff Hammond, Sotiris S. Xantheas, Martin Ganahl, Frank Neese
分类：physics.chem-ph, cond-mat.str-el
原文链接：http://arxiv.org/abs/2503.20700v1

中文摘要：我们提出了一种高效的轨道优化方法，该方法将高度GPU加速的自旋适应密度矩阵重整化群（DMRG）与ORCA程序包中实现的量子化学完全活性空间自洽场（CAS-SCF）方法相结合。利用最新一代Nvidia GPU硬件的计算能力，我们在包含数千个轨道中数百个电子活性空间尺寸的分子体系中，实现了前所未有的CAS尺寸（82个电子在82个轨道CAS(82,82)）的CAS-SCF轨道优化。针对NVIDIA DGX-A100和DGX-H100硬件，我们对多环芳烃和不同尺寸铁硫复合物构成的基准体系进行了详细的DMRG-SCF方法缩放和误差分析。我们的工作首次证明，在大键维度下进行高精度DMRG计算对于获得可靠收敛的CAS-SCF 能量至关重要。对于更具挑战性的铁硫基准体系，我们还发现收敛CAS-SCF计算的优化轨道对DMRG 参数的敏感性高于多环芳烃体系。能够在数天内获得如此大尺寸活性空间的收敛CAS-SCF 能量和轨道，降低了将适当轨道纳入CAS或选择正确最小CAS的挑战，可能为处理强关联分子体系开辟全新途径。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数极大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：我们研究一维高斯位置混合模型的非参数极大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定n个数据点时该估计量总是返回最多含n个分量的混合模型，而近期(Wu-Polyanskiy, 2020)对亚高斯数据给出了精确的$O(\log n)$界。本文重点研究$\widehat{\pi}$的计算特性：我们提出一种算法，当$\varepsilon>0$足够小时，可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算出Wasserstein距离意义下的$\varepsilon$近似解，其中$K$与数据相关但与$\varepsilon$无关，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子数。我们还可在有限时间内确定性计算出$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有密度函数（相对于Lebesgue测度）的概率分布独立采样时，这些保证几乎必然成立。我们还证明：当$k\leq \sqrt{n}/3$时，限定为k原子型的$\widehat\pi$条件分布在相应$2k-1$维参数空间上具有密度函数，且EM算法几乎必然具有局部线性收敛性。关键工具之一是对非退化曲线的经典傅里叶分析估计。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子间势的聚合物电解质膜质子传输大规模长时原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势能（MLIPs）作为一种能够实现大规模、长时间原子尺度模拟的方法，同时保持与基于密度泛函理论（DFT）和从头算波函数理论的电子结构计算相当的精度，引起了广泛关注。然而，基于MLIP的分子动力学（MD）模拟面临的一个挑战是，与传统经典势能相比，其稳定性较低。分析高度异质体系或非晶材料通常需要大规模和长时间的模拟，因此需要开发能够进行稳定MD模拟的鲁棒MLIPs。在本研究中，我们利用神经网络势能（NNP）生成器，构建了一个NNP模型，能够在广泛水合水平范围内对全氟离子交换膜（Nafion）进行大规模、长时间的MD模拟。通过主动学习循环迭代扩展数据集，我们成功构建了一个鲁棒的深度势能（DP）模型。具体而言，通过将非平衡 DPMD模拟采样的非平衡结构与结合最小原子间距离的三维结构特征空间中的结构筛选相结合，可以显著增强DP模型的鲁棒性，从而实现对约10,000至20,000个原子的大型Nafion体系进行长达31 ns的稳定MD模拟。采用所开发的DP模型进行的MD模拟，与之前较小体系的从头算MD模拟相比，在广泛水合水平范围内获得的氢原子自扩散系数更接近实验值。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：一个开放、快速、可靠且高效的每日任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过将地址复制到多个位置来实现（例如）降低延迟和增强韧性。由于任播在现代互联网中的关键作用，先前研究已引入工具来执行任播普查。首个工具iGreedy利用地理分散位置的延迟测量来映射任播部署；第二个工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查，但其准确性和精确性存在缺陷。相反，iGreedy精度极高但速度较慢，且探测成本更高。本文针对这两个系统的不足，提出了MAnycast Reloaded（MAnycastR）。以MAnycast2为基础，我们彻底重构了其测量流水线，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR，与外部任播生产部署进行对比，通过RIPE Atlas进行广泛延迟测量，并对检测到的60%以上任播前缀进行运营商数据交叉验证。结果表明MAnycastR实现了高准确性与精确度。我们将持续提供每日MAnycastR普查数据，并以宽松开源协议发布工具源代码。

摘要

原文标题：Flow of a two-dimensional liquid foam: Impact of surfactant type and boundary conditions
中文标题：二维液体泡沫流动：表面活性剂类型与边界条件的影响
发布日期：2025-03-26 16:44:40+00:00
作者：Farshad Nazari, Andrei Potanin, Hadi Mohammadigoushki
分类：cond-mat.soft, physics.flu-dyn
原文链接：http://arxiv.org/abs/2503.20710v1

中文摘要：摘要：本研究通过实验探究了二维单分散水性泡沫的流变与流动行为。使用自制具有光滑/粗糙壁面的流变光学装置，在平行板间对泡沫施加剪切。实验采用两种商用洗涤剂（Foam1和Foam2）制备泡沫，保持气泡尺寸和液相分数相近。线性粘弹性结果表明：无论边界条件如何，Foam1始终表现出比Foam2更高的弹性模量和损耗模量，且粗糙壁面会进一步增强两种泡沫的模量。此外，Foam1的粘弹性松弛频率较低，表明其界面流动性较弱。在非线性区域观察到显著差异：光滑边界条件下，Foam2呈现屈服应力行为而Foam1没有，尽管后者具有更高的粘性应力。Foam1的粘性应力与毛细管数呈比例关系，而Foam2的标度关系则因光滑/粗糙壁面边界条件呈现不同特征。这些流变行为差异源于表面活性剂化学性质的不同所导致的界面流动性差异，其中Foam1的界面流动性低于Foam2。

摘要

原文标题：Search for events with one displaced vertex from long-lived neutral particles decaying into hadronic jets in the ATLAS muon spectrometer in $pp$ collisions at $\sqrt{s}=13$ TeV
中文标题：在$\sqrt{s}=13$ TeV的$pp$对撞中ATLASμ子谱仪内长寿命中性粒子衰变为强子喷注产生单位移顶点的事例搜寻
发布日期：2025-03-26 11:21:36+00:00
作者：ATLAS Collaboration
分类：hep-ex
原文链接：http://arxiv.org/abs/2503.20445v1

中文摘要：摘要：本文报道了利用ATLAS探测器在大型强子对撞机上收集的数据（2015-2018年记录的140 fb$^{-1}$、$\sqrt{s}=13$ TeV质子-质子对撞数据）对长寿命中性粒子衰变为强子喷注产生单位移顶点事件的搜寻。该研究采用顶点重建技术，针对μ子谱仪中距主相互作用顶点3-14米处衰变的长寿命粒子。观测事件数与预期本底相符，并确定了若干基准信号模型的限制。研究考虑了标量门户模型和希格斯玻色子门户重子生成模型，同时采用专用分析道针对Z玻色子伴随的长寿命粒子产生过程（包括类轴子粒子和暗光子模型）。对于希格斯玻色子模型，在95%置信水平下排除了长寿命粒子固有衰变长度5厘米至40米范围内分支比高于1%的情况。对于所研究的避光类轴子粒子模型，本次搜寻对固有衰变长度大于$\mathcal{O}(10)$厘米的情况给出了迄今最强的限制。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：基于属性图的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：给定图$G$和种子节点$v_s$，局部图聚类（LGC）的目标是在与$C_s$大小近似线性时间内识别围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图的应用场景。然而现有方案大多仅依赖图中节点的拓扑连接性，容易受到现实图谱中普遍存在的缺失链接或噪声链接的影响。为解决该问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC建模为双向扩散分布（BDD）估计问题，该模型专门用于捕捉带属性节点的多跳关联性。进一步提出LACA方法——一种高效且具备严格理论保证的LGC方案：其核心包括（i）基于理论基础的快速节点属性预处理技术；（ii）具备加速收敛特性的自适应图向量扩散算法；（iii）BDD近似计算的三步优化框架。在8个真实数据集上与17种基线方法的对比实验表明，LACA在真实局部簇标准下的结果质量显著优于所有对比方法，同时速度可提升数个数量级。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重构动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会新陈代谢系统。供应链网络绝非静态存在，而是通过企业的进出与供应关系的重组不断变化。本文利用独特数据集研究了一个国家供应链网络中企业及其供应商-客户关系的时间演化。基于匈牙利2014至2022年按月申报的增值税数据，我们重建了包含711,248家企业和38,644,400条连接的完整经济网络，以企业级分辨率覆盖了整个经济体的几乎所有重构事件。研究发现：每年约25%的企业退出供应链网络，同时28%的新企业加入；平均55%的现存供应链接会在次年消失；供应链接的半衰期为13个月。新链接以超偏好依附方式连接企业，概率满足$p(i)\propto k_i^{1.08}$（$k_i$表示企业$i$的供应连接数）。我们校准了一个能复现匈牙利主导供应链网络典型特征的简单统计网络生成模型，该模型不仅再现了入度/出度分布、同配性和聚类结构等局部网络特征，还捕捉了真实的系统性风险特征。最后讨论了当前模型如何通过经济重连动态来量化系统韧性并评估冲击传导。

摘要

原文标题：The Scalar Size of the Pion from Lattice QCD
中文标题：格点QCD中π介子的标量大小
发布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分类：hep-lat, hep-ph
原文链接：http://arxiv.org/abs/2503.20687v1

中文摘要：我们提出了一种系统误差完全受控的格点QCD计算，用于确定π介子标量形状因子及相关半径。计算结果基于17个规范场组态的大规模集合，采用$N_f=2+1$味的Wilson-Clover改进海夸克。这些组态覆盖了从$a=0.049\mathrm{fm}$到$a=0.086\mathrm{fm}$四种格距，$130-350\mathrm{MeV}$的π介子质量范围以及多种物理体积。通过精确计算著名的夸克断开贡献，我们在接近物理夸克质量的大体积精细组态上实现了形状因子前所未有的动量分辨率。采用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$范围内多种源汇间距，可靠地提取了零动量转移与非零动量转移下的基态矩阵元。这使得我们首次能够通过所得形状因子$Q^2$依赖性的$z$展开参数化（而非小动量转移下的简单线性近似）获得标量半径。使用三味NLO手征微扰理论对半径进行物理外推，通过三个低能常数（包括首次格点确定的$L_4^r$）参数化夸克质量依赖性。基于赤池信息准则的模型平均方法，系统评估了基态提取、形状因子参数化以及物理外推对最终结果的系统不确定性。

摘要

原文标题：Ion beam treatment of thick polystyrene films
中文标题：厚聚苯乙烯薄膜的离子束处理
发布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分类：physics.chem-ph
原文链接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋涂厚度为78纳米至1.3微米的不同厚度聚苯乙烯薄膜，并用能量为20 keV的氮离子进行处理。椭圆偏振测量和傅里叶变换红外光谱显示，表面层的改性对应于离子在聚合物中的穿透深度（约70纳米）。然而，对深层进行清洗和后续测量表明，在薄改性层中形成的自由基会迁移到体层中，并引起深层聚苯乙烯化学结构的多种变化。因此，尽管离子在聚苯乙烯薄膜中的穿透深度较小，但整个薄膜的改性深度远大于离子的投影射程。因此，离子束处理聚合物仅在条件上是一种表面改性方法。必须考虑自由基反应及其向聚合物深层迁移的可能性。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数极大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：我们研究一维高斯位置混合的非参数极大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知：给定n个数据点时，该估计量始终返回最多含n个混合模型；近期(Wu-Polyanskiy, 2020)进一步对次高斯数据给出了精确的$O(\log n)$界。本文重点研究$\widehat{\pi}$的计算特性：我们提出一种算法，当$\varepsilon>0$足够小时，可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算出Wasserstein距离意义上的$\varepsilon$近似解，其中$K$与数据相关但与$\varepsilon$无关，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子数量。我们还实现了支撑集基数$|supp(\widehat\pi)|$的有限时间可验证计算。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$来自具有Lebesgue测度密度的独立分布时，这些保证几乎必然成立。此外，我们证明当$k\leq \sqrt{n}/3$时，限定为k原子结构的$\widehat\pi$条件分布在相应$2k-1$维参数空间上具有密度，且EM算法几乎必然局部线性收敛。关键工具之一是非退化曲线的经典傅里叶分析估计。

摘要

原文标题：Orbital optimization of large active spaces via AI-accelerators
中文标题：基于AI加速器的大活性空间轨道优化方法
发布日期：2025-03-26 16:29:44+00:00
作者：Örs Legeza, Andor Menczer, Ádám Ganyecz, Miklós Antal Werner, Kornél Kapás, Jeff Hammond, Sotiris S. Xantheas, Martin Ganahl, Frank Neese
分类：physics.chem-ph, cond-mat.str-el
原文链接：http://arxiv.org/abs/2503.20700v1

中文摘要：我们提出了一种高效的轨道优化方法，该方法将高度GPU加速的自旋适应密度矩阵重整化群（DMRG）与ORCA程序包中实现的量子化学完全活性空间自洽场（CAS-SCF）方法相结合。利用最新一代Nvidia GPU硬件的计算能力，我们在包含数千个轨道中数百个电子活性空间尺寸的分子体系中，实现了前所未有的CAS尺寸轨道优化——高达82个电子和82个轨道CAS(82,82)。针对NVIDIA DGX-A100和DGX-H100硬件，我们对多环芳烃和不同尺寸铁硫配合物基准体系进行了详细的DMRG-SCF方法缩放和误差分析。研究首次证明：在大键维度下进行高精度 DMRG计算对获得可靠收敛的CAS-SCF能量至关重要。对于更具挑战性的铁硫基准体系，我们还发现收敛CAS-SCF计算的优化轨道对DMRG参数的敏感性高于多环芳烃体系。能在数日内获得如此大尺寸活性空间的收敛CAS-SCF能量和轨道，不仅降低了将适当轨道纳入CAS或选择正确最小CAS的挑战，还可能为处理强关联分子体系开辟全新途径。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势（MLIPs）作为一种能够实现大规模、长时间原子模拟并保持与基于密度泛函理论（DFT）和从头算波函数理论的电子结构计算相当精度的方法，受到了广泛关注。然而，基于MLIP的分子动力学（MD）模拟面临的关键挑战是其稳定性低于传统经典势函数。分析高度异质体系或非晶材料通常需要大规模长时间模拟，这要求开发能够实现稳定MD模拟的鲁棒性MLIP。本研究利用我们的神经网络势（NNP）生成器，构建了一个能在广泛水合水平范围内对全氟离聚物膜（Nafion）进行大规模长时间MD模拟的NNP模型。通过主动学习循环迭代扩展数据集，我们成功建立了鲁棒的深度势（DP）模型。具体而言，通过将非平衡DPMD模拟采样的非平衡结构与结合最小原子间距的三维结构特征空间筛选相结合，可显著提升DP模型的鲁棒性，从而实现对约10,000至20,000原子的大型Nafion体系进行长达31纳秒的稳定MD模拟。采用所开发DP模型的MD模拟获得的氢原子自扩散系数，在广泛水合水平范围内比先前小体系从头算MD模拟结果更接近实验值。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：多播重装上阵：面向开放、快速、可靠且高效日常多播普查的工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过将地址复制到多个位置来实现降低延迟和增强韧性等目标。鉴于任播在现代互联网中的关键作用，先前研究已开发了执行任播普查的工具。首个工具iGreedy利用地理分散位置的延迟测量来绘制任播部署图；第二个工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查，但存在准确性和精确性问题。反之，iGreedy精度极高但速度较慢，且探测成本更高。本文针对这两个系统的缺陷提出了MAnycast Reloaded（MAnycastR）。以MAnycast2为基础，我们彻底重构了其测量管道，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR，对比实际任播生产部署，通过RIPE Atlas进行广泛延迟测量，并将检测到的任播前缀中超过60%与运营商真实数据进行交叉验证。结果表明MAnycastR实现了高准确性与精确度。我们以宽松的开源许可向社区提供每日持续的MAnycastR普查数据，并公开该工具的源代码。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：基于属性图的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：给定图$G$和种子节点$v_s$，局部图聚类（LGC）的目标是在与$C_s$大小大致成线性关系的时间内，识别出围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图的应用场景。然而，现有解决方案大多仅依赖图中节点的拓扑连接关系，容易受到现实图数据中普遍存在的缺失边或噪声边的影响。为解决该问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC问题建模为双向扩散分布（BDD）估计问题，该模型专门用于捕捉带属性节点的多跳关联性。进一步提出LACA方法——一种高效且具备严格理论保证的LGC解决方案：其核心包括（i）基于理论基础的快速节点属性预处理技术，（ii）具备加速收敛特性的自适应向量扩散算法，以及（iii）BDD近似计算的三步优化方案。在8个真实数据集上与17种基线方法的对比实验表明，LACA在真实局部簇的评估指标上全面优于所有对比方法，同时实现数量级的速度提升。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重连动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会代谢系统。SCN绝非静态存在，而是通过企业的进出与供应关系的重组持续演变。本研究利用独特数据集追踪了一个国家供应链网络中企业及其供需关系的时序演化。基于匈牙利2014至2022年按月申报的增值税数据，我们重建了包含711,248家企业和38,644,400条连接的整体经济网络，实现了企业级分辨率的经济结构全息记录。研究发现：每年约25%的企业退出SCN，同时28%的新企业加入；平均55%的年度供应关系会在次年消失；供应关系的半衰期为13个月。新连接以超偏好依附概率$p(i)\propto k_i^{1.08}$（$k_i$表示企业i的连接数）形成。我们校准的简易统计网络生成模型成功复现了匈牙利主导SCN的典型特征，不仅能重现入/出度分布、同配性和聚类结构等局部特征，还能捕捉真实的系统性风险轮廓。该模型揭示了经济网络重连动力学对量化系统韧性和估计冲击传导的关键作用。

摘要

原文标题：The Scalar Size of the Pion from Lattice QCD
中文标题：格点QCD中π介子的标量大小
发布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分类：hep-lat, hep-ph
原文链接：http://arxiv.org/abs/2503.20687v1

中文摘要：我们提出了一种系统误差完全受控的格点QCD计算，用于确定π介子标量形状因子及相关半径。计算结果基于17个规范系综的大规模数据集，这些系综采用$N_f=2+1$威尔逊Clover改进海夸克配置，涵盖$a=0.049\mathrm{fm}$至$a=0.086\mathrm{fm}$四种晶格间距、$130-350\mathrm{MeV}$的π介子质量范围及多种物理体积。通过对棘手夸克断开贡献的精确测定，我们在接近物理夸克质量的大尺寸精细系综上实现了形状因子前所未有的动量分辨率。采用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$的大范围源汇间距，可靠地提取了零动量转移与非零动量转移下的基态矩阵元。这使得我们首次能通过所得形状因子$Q^2$依赖性的$z$展开参数化（而非小动量转移下的简单线性近似）获取标量半径。物理外推采用三味NLO手征微扰理论，以三个低能常数（包括$L_4^r$的首个格点测定值）参数化夸克质量依赖性。通过基于赤池信息准则的模型平均，系统评估了基态提取、形状因子参数化及物理外推对最终结果的系统不确定性。

摘要

原文标题：Ion beam treatment of thick polystyrene films
中文标题：厚聚苯乙烯薄膜的离子束处理
发布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分类：physics.chem-ph
原文链接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋涂厚度为78纳米至1.3微米的不同厚度聚苯乙烯薄膜，采用能量为20 keV的氮离子束进行处理。椭偏仪测量和傅里叶变换红外光谱显示，表面层的改性对应于离子在聚合物中的穿透深度（约70纳米）。然而，对深层进行清洗和后续测量表明，在薄改性层中形成的自由基会迁移至本体层，并导致深层聚苯乙烯化学结构发生一系列变化。因此，尽管离子在聚苯乙烯薄膜中的穿透深度较小，但整个薄膜的改性深度远大于离子的投影射程。由此可见，聚合物离子束处理仅在特定条件下可视为表面改性方法。必须考虑自由基反应及其向聚合物深层迁移的可能性。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数最大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：我们研究一维高斯位置混合模型的非参数最大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定n个数据点时，该估计量总是返回最多含n个分量的混合模型，而近期(Wu-Polyanskiy, 2020)对亚高斯数据给出了严格的$O(\log n)$界。本文研究$\widehat{\pi}$的计算特性：我们提出的算法能在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算Wasserstein距离下的$\varepsilon$近似解，其中$K$与$\varepsilon$无关但依赖数据，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子数。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$来自具有密度（相对于Lebesgue测度）的概率分布时，这些保证几乎必然成立。我们进一步证明：当$k\leq \sqrt{n}/3$时，限定为k原子结构的$\widehat\pi$条件分布在相关$2k-1$维参数空间上存在密度，且EM算法几乎必然具有局部线性收敛性。关键工具之一是非退化曲线的经典傅里叶分析估计。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势（MLIPs）作为一种能够实现大规模、长时间原子模拟的方法备受关注，同时保持与基于密度泛函理论（DFT）和从头算波函数理论的电子结构计算相当的精度。然而，基于MLIP的分子动力学（MD）模拟面临的挑战是其稳定性低于使用传统经典势的模拟。分析高度异质体系或非晶材料通常需要大规模和长时间的模拟，因此需要开发能够实现稳定MD模拟的鲁棒MLIPs。在本研究中，我们利用神经网络势（NNP）生成器，构建了一个NNP模型，能够在广泛水合水平下对全氟离聚物膜（Nafion）进行大规模、长时间的MD模拟。通过主动学习循环迭代扩展数据集，我们成功建立了鲁棒的深度势（DP）模型。具体而言，通过将非平衡DPMD模拟采样的非平衡结构与结合最小原子间距离的三维结构特征空间中的结构筛选相结合，可以显著增强DP模型的鲁棒性，从而实现对约10,000至20,000个原子的大型Nafion体系进行长达31 ns的稳定MD模拟。采用所开发DP模型的MD模拟获得的氢原子自扩散系数，在广泛水合水平范围内与实验值更为接近，优于先前对小体系进行的从头算MD模拟结果。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：多播重装上阵：一个开放、快速、可靠且高效的日常多播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过在多位置复制地址来实现降低延迟和增强韧性等目标。由于任播在现代互联网中的关键作用，先前研究已开发了多种任播普查工具。首款工具iGreedy通过地理分散的延迟测量来绘制任播部署图；第二款工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——仅需3小时即可完成全网普查，但存在准确性和精确度问题。反之，iGreedy精度极高但速度较慢，且探测成本显著更高。本文针对这两个系统的缺陷，提出了升级版MAnycast Reloaded（MAnycastR）。以MAnycast2为基础，我们彻底重构了其测量流程，新增分布式探测支持、多协议（UDP/TCP/IPv6）兼容性以及类似iGreedy的延迟测量功能。通过在含32个全球分布式节点的任播测试床上验证，与真实任播生产环境对比，并利用RIPE Atlas进行大规模延迟测量交叉检验（其中60%以上检测到的任播前缀通过运营商真实数据复核），证明MAnycastR具备高准确性与精确度。我们将持续提供每日任播普查数据，并以宽松开源协议发布工具源代码。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：基于属性图的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：给定图$G$和种子节点$v_s$，局部图聚类（LGC）的目标是在与$C_s$大小近似线性相关的时间内，识别出围绕$v_s$的子图$C_s$（即局部簇）。该方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图的应用场景。然而现有方案大多仅依赖图中节点的拓扑连接性，容易受到现实图数据中普遍存在的缺失链接或噪声链接的影响。为解决该问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC建模为双向扩散分布（BDD）的估计问题，该模型专门用于捕捉含属性图中节点的多跳关联性。进一步提出LACA方法——一种高效且具备强局部性的LGC解决方案，在多个真实数据集上展现出卓越性能。其核心组件包括：（i）基于理论基础的快速节点属性预处理技术；（ii）具备严格理论保证和加速收敛特性的自适应向量扩散算法；（iii）高效的三步式BDD近似方案。通过在8个真实数据集上与17种对比方法的实验表明，LACA在真实局部簇标准下的结果质量优于所有对比方法，同时速度可提升数个数量级。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重构动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成了任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会新陈代谢系统。供应链网络绝非静态，而是通过企业的进出和供应关系的重组不断变化。本文利用独特数据集研究了一个国家供应链网络中企业及其供应商-买方关系的时间演化。基于匈牙利2014至2022年每月报告的增值税数据，我们重建了包含711,248家企业和38,644,400条连接的整体经济网络，以企业级分辨率覆盖了几乎整个经济体的所有重构事件。研究发现：每年约25%的企业退出供应链网络，同时28%的新企业加入；平均55%的现有供应链接会在次年消失；供应链接的半衰期为13个月。新链接以超偏好依附概率$p(i)\propto k_i^{1.08}$（$k_i$表示企业i的供应连接数）附着于企业。我们校准了一个能复现匈牙利主导供应链网络典型特征的简单统计网络生成模型，该模型不仅复现了入/出度分布、同配性和聚类结构等局部网络特征，还捕捉了真实的系统性风险特征。最后讨论了该模型如何通过经济重连动态来量化系统韧性和估计冲击传导。

摘要

原文标题：The Scalar Size of the Pion from Lattice QCD
中文标题：π介子标量尺寸的格点QCD计算
发布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分类：hep-lat, hep-ph
原文链接：http://arxiv.org/abs/2503.20687v1

中文摘要：我们采用格点QCD方法计算了π介子标量形状因子及相关半径，并实现了系统误差的完全控制。计算结果基于17组N_f=2+1威尔逊Clover改进海夸克的规范系综，涵盖0.049-0.086fm四种晶格间距、130-350MeV的π介子质量范围及多种物理体积。通过对著名的夸克断开贡献的精确测定，我们在接近物理夸克质量的大尺寸精细系综上实现了形状因子前所未有的动量分辨率。采用1.0-3.25fm宽范围的源汇分离距离，可靠地提取了零动量转移和非零动量转移下的基态矩阵元。这使得我们首次能通过形状因子Q^2依赖性的z-展开参数化（而非小动量转移下的简单线性近似）获得标量半径。使用三味NLO手征微扰理论将夸克质量依赖性参数化为三个低能常数（包含L_4^r的首次格点测定）进行物理外推，并通过基于赤池信息准则的模型平均方法处理基态提取、形状因子参数化及物理外推相关的系统误差。

摘要

原文标题：Ion beam treatment of thick polystyrene films
中文标题：厚聚苯乙烯薄膜的离子束处理
发布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分类：physics.chem-ph
原文链接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋涂厚度为78纳米至1.3微米的聚苯乙烯薄膜，经20 keV氮离子束处理后，椭圆偏振测量和傅里叶变换红外光谱显示表面改性层对应于离子在聚合物中的穿透深度（约70纳米）。然而，深层洗涤及后续测量表明，薄改性层中形成的自由基会迁移至本体层，导致深层聚苯乙烯化学结构发生一系列变化。因此，尽管离子在聚苯乙烯薄膜中的穿透深度较浅，但整个薄膜的改性深度远超过离子的投影射程。由此可见，聚合物离子束处理仅在特定条件下属于表面改性方法，必须考虑自由基反应及其向聚合物深层迁移的可能性。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数最大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：摘要：我们研究一维高斯位置混合的非参数极大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定n个数据点时，该估计量始终返回最多含n个分量的混合模型，而近期(Wu-Polyanskiy, 2020)对亚高斯数据给出了尖锐的$O(\log n)$界。本文研究$\widehat{\pi}$的计算特性：针对足够小的$\varepsilon>0$，我们提出算法可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算Wasserstein距离意义上的$\varepsilon$近似解，其中$K$与数据相关但与$\varepsilon$无关，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子数。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有密度（相对于Lebesgue测度）的概率分布独立采样时，这些保证几乎必然成立。我们还证明：当$k\leq \sqrt{n}/3$时，限定为k原子性的$\widehat\pi$条件分布在相应$2k-1$维参数空间上具有密度，且EM算法几乎必然局部线性收敛。关键工具之一是非退化曲线的经典傅里叶分析估计。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子势的大规模长时质子交换膜质子传输原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势（MLIPs）作为一种能够实现大规模、长时间原子模拟的方法备受关注，同时保持与基于密度泛函理论（DFT）和从头算波函数理论的电子结构计算相当的精度。然而，基于MLIP的分子动力学（MD）模拟面临的挑战是其稳定性低于使用传统经典势的模拟。分析高度异质体系或非晶材料通常需要大规模和长时间的模拟，因此需要开发能够进行稳定MD模拟的鲁棒MLIPs。在本研究中，我们利用神经网络势（NNP）生成器，构建了一个NNP模型，能够在广泛水合水平下对全氟离聚物膜（Nafion）进行大规模、长时间的MD模拟。通过主动学习循环迭代扩展数据集，我们成功构建了鲁棒的深度势（DP）模型。具体而言，通过结合非平衡DPMD模拟采样的非平衡结构，以及在包含最小原子间距离的3D结构特征空间中进行结构筛选，可以显著增强DP模型的鲁棒性，从而实现对约10,000至20,000个原子的大型Nafion系统进行长达31 ns的稳定MD模拟。采用所开发DP模型的MD模拟得到的氢原子自扩散系数，在广泛水合水平范围内与实验值更为接近，优于先前对小体系进行的从头算MD模拟结果。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：开放、快速、可靠且高效的日常任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过将地址复制到多个位置来实现降低延迟和增强韧性等目标。由于任播在现代互联网中的关键作用，先前研究已开发了执行任播普查的工具。首个工具iGreedy利用地理分散位置的延迟测量来绘制任播部署图；第二个工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——仅需3小时即可完成全网普查，但存在准确性和精确性问题。相反，iGreedy准确性极高但速度较慢，且探测成本更高。本文针对这两个系统的缺陷提出了MAnycast Reloaded（MAnycastR）。以MAnycast2为基础，我们彻底重新设计了其测量流程，新增了分布式探测支持、额外协议（UDP、TCP和IPv6）支持以及类似iGreedy的延迟测量功能。我们在包含32个全球分布式节点的任播测试平台上验证MAnycastR，与外部任播生产部署进行对比，并通过RIPE Atlas进行广泛延迟测量，同时对检测到的60%以上任播前缀进行运营商实地验证交叉检查。结果表明MAnycastR实现了高准确性和精确度。我们将持续提供每日MAnycastR普查数据，并以宽松的开源许可协议发布该工具的源代码。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：基于属性图的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：给定图$G$和种子节点$v_s$，局部图聚类（LGC）的目标是在与$C_s$大小大致成线性关系的时间内，识别出围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图的应用场景。然而，现有解决方案大多仅依赖图中节点的拓扑连接性，容易受到现实图数据中普遍存在的缺失或噪声链接的影响。为解决该问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC建模为双向扩散分布（BDD）的估计问题，该模型专门用于捕捉带属性节点的多跳关联性。进一步提出LACA方法——一种高效且具备强局部性的LGC解决方案，在多个真实数据集上表现出卓越性能。其核心组件包括：(i) 基于理论基础的快速节点属性预处理技术，(ii) 具有严格理论保证和加速收敛特性的自适应向量扩散算法，(iii) 高效的三步式BDD近似方案。通过在8个真实数据集上与17种对比方法的实验表明，LACA在真实局部簇标准下的结果质量优于所有对比方法，同时速度可提升数个数量级。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重构动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会新陈代谢系统。SCN绝非静态存在，而是通过企业的进出与供应关系的重组持续演变。本研究利用独特数据集追踪了一个国家SCN中企业及其供应商-客户关系的时间演化。基于匈牙利2014至2022年每月报告的增值税数据，我们重建了包含711,248家企业和38,644,400条连接的整体经济网络，以企业级分辨率覆盖了近乎所有经济重构事件。研究发现：每年约25%的企业退出SCN，同时28%的新企业加入；平均55%的现存供应链接会在次年消失；供应链接的半衰期为13个月。新链接以超偏好依附方式连接企业，概率满足$p(i)\propto k_i^{1.08}$（$k_i$表示企业i的供应连接数）。我们校准了一个能复现匈牙利主导SCN典型特征的统计网络生成模型，该模型不仅再现了入/出度分布、同配性和聚类结构等局部网络特征，还捕捉了真实的系统性风险轮廓。最后探讨了经济重连动态对量化系统韧性和估计冲击传导的关键作用。

摘要

原文标题：The Scalar Size of the Pion from Lattice QCD
中文标题：π介子标量尺寸的格点QCD计算
发布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分类：hep-lat, hep-ph
原文链接：http://arxiv.org/abs/2503.20687v1

中文摘要：我们提出了一种系统误差完全受控的格点QCD计算，用于确定π介子标量形状因子及相关半径。计算结果基于17个规范系综的大规模数据集，这些系综采用$N_f=2+1$威尔逊Clover改进的海夸克。这些系综覆盖了从$a=0.049\mathrm{fm}$到$a=0.086\mathrm{fm}$四种格点间距，π介子质量范围为$130-350\mathrm{MeV}$以及多种物理体积。通过精确计算著名的夸克断开贡献，我们首次在接近物理夸克质量的大尺寸精细系综上实现了形状因子前所未有的动量分辨率。采用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$的大范围源汇间距，可靠地提取了零动量转移和非零动量转移下的相关基态矩阵元。这使得我们首次能够通过所得形状因子$Q^2$依赖性的$z$展开参数化（而非小动量转移下的简单线性近似）来获取标量半径。半径的物理外推采用三味NLO手征微扰理论，通过三个低能常数（包括$L_4^r$的首次格点测定）来参数化夸克质量依赖性。基于赤池信息准则的模型平均方法，我们对基态提取、形状因子参数化以及物理外推等环节产生的系统误差进行了量化处理。

摘要

原文标题：Ion beam treatment of thick polystyrene films
中文标题：厚聚苯乙烯薄膜的离子束处理
发布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分类：physics.chem-ph
原文链接：http://arxiv.org/abs/2503.20359v1

中文摘要：在硅片上旋涂的不同厚度（78纳米至1.3微米）聚苯乙烯薄膜经20 keV氮离子束处理后，椭偏仪测量和傅里叶变换红外光谱显示表面改性层深度与离子在聚合物中的穿透深度（约70纳米）相符。然而，深层洗涤及后续测试表明，薄改性层中形成的自由基会迁移至本体层，导致深层聚苯乙烯化学结构发生系列变化。因此，尽管离子在聚苯乙烯膜中的穿透深度较浅，整个薄膜的改性深度仍远超过离子投影射程。这表明离子束处理仅能有条件地视为表面改性方法，必须考虑自由基反应及其向聚合物深层迁移的可能性。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数极大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：我们研究一维高斯位置混合模型的非参数最大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定n个数据点时该估计量总是返回最多含n个分量的混合模型，而近期(Wu-Polyanskiy, 2020)对亚高斯数据给出了严格的$O(\log n)$界。本文重点研究$\widehat{\pi}$的计算特性：我们提出的算法能在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算出Wasserstein距离意义上的$\varepsilon$近似解，其中$K$与数据相关但与$\varepsilon$无关，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子数量。该算法还能在有限时间内确定性地计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$中的点独立采样自具有Lebesgue测度密度的概率分布时，这些保证几乎必然成立。我们还证明：当$k\leq \sqrt{n}/3$时，限定为k原子型的$\widehat\pi$条件分布在相应$2k-1$维参数空间上存在密度函数，且EM算法几乎必然具有局部线性收敛性。关键工具之一是对非退化曲线的经典傅里叶分析估计。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子势的大规模长时质子传输聚合物电解质膜原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势能（MLIPs）作为一种能够实现大规模、长时间原子模拟并保持与基于密度泛函理论（DFT）和从头算波函数理论的电子结构计算相当精度的方法，受到广泛关注。然而，基于MLIP的分子动力学（MD）模拟面临的关键挑战是其稳定性低于传统经典势能方法。分析高度异质体系或非晶材料通常需要大规模长时间模拟，因此亟需开发能够实现稳定MD模拟的鲁棒性MLIP。本研究利用自主开发的神经网络势能（NNP）生成器，构建了可在广泛水合水平下对全氟离聚物膜（Nafion）进行大规模长时间MD模拟的NNP模型。通过主动学习循环迭代扩展数据集，我们成功建立了鲁棒的深度势能（DP）模型。具体而言，通过结合非平衡DPMD模拟采样的非平衡结构，以及在包含最小原子间距的三维结构特征空间中进行结构筛选，可显著提升DP模型的鲁棒性。该模型能对约10,000至20,000个原子的大型Nafion体系进行长达31纳秒的稳定MD模拟。采用所开发DP模型的MD模拟结果表明，与先前小体系从头算MD模拟相比，氢原子自扩散系数在更广泛水合水平范围内与实验值更为吻合。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：多播重装上阵：开放、快速、可靠且高效的日常任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过在多位置复制地址来实现降低延迟和增强韧性等目标。鉴于任播在现代互联网中的关键作用，先前研究已开发了执行任播普查的工具。首个工具iGreedy利用地理分散位置的延迟测量来绘制任播部署图；第二个工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查，但存在准确性和精确度问题。反之，iGreedy精度极高但速度较慢，且探测成本显著更高。本文针对这两个系统的缺陷，提出了升级版MAnycast Reloaded（MAnycastR）。以MAnycast2为基础，我们彻底重构了其测量流水线，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR，与外部任播生产部署进行对比，通过RIPE Atlas进行广泛延迟测量，并对检测到的60%以上任播前缀进行运营商数据交叉核验。结果表明MAnycastR实现了高准确性与精确度。我们将持续提供每日MAnycastR普查数据，并以宽松开源协议发布工具源代码。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：基于属性图的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：给定图$G$和种子节点$v_s$，局部图聚类(LGC)的目标是在与$C_s$大小近似线性相关的时间内，识别出围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图的应用场景。然而，现有解决方案大多仅依赖图中节点的拓扑连接性，容易受到现实图数据中普遍存在的缺失或噪声链接的影响。为解决这一问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC建模为双向扩散分布(BDD)的估计问题，该模型专门用于捕捉含属性图中节点的多跳关联性。进一步提出LACA方法——一种高效且具备强局部性的LGC解决方案，在多个真实数据集上表现出卓越性能。其核心组件包括：(i) 基于理论基础的快速节点属性预处理技术；(ii) 具有严格理论保证和加速收敛特性的自适应向量扩散算法；(iii) 有效的BDD近似三步方案。通过在8个真实数据集上与17种对比方法的实验表明，LACA在真实局部簇标准下的结果质量优于所有对比方法，同时速度可提升数个数量级。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重构动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会新陈代谢系统。SCN绝非静态存在，而是通过企业的进出与供应关系的重组持续演变。本研究利用独特数据集追踪了一个国家SCN中企业及其供应商-客户关系的时间演化。基于匈牙利2014至2022年按月申报的增值税数据，我们重建了包含711,248家企业和38,644,400条连接的整体经济网络，以企业级分辨率覆盖了近乎所有经济重构事件。研究发现：每年约25%的企业退出SCN，同时28%的新企业加入；平均55%的现存供应链接会在次年消失；供应链接的半衰期为13个月。新链接以超偏好依附方式连接企业，概率满足$p(i)\propto k_i^{1.08}$（$k_i$为企业i的供应连接数）。我们校准的简易统计网络生成模型成功复现了匈牙利主导SCN的典型特征，不仅能重现入/出度分布、同配性和聚类结构等局部网络特征，还能捕捉真实的系统性风险轮廓。最后探讨了该模型如何通过经济重连动态来量化系统韧性及评估冲击传导。

摘要

原文标题：The Scalar Size of the Pion from Lattice QCD
中文标题：格点QCD中π介子标量大小的计算
发布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分类：hep-lat, hep-ph
原文链接：http://arxiv.org/abs/2503.20687v1

中文摘要：我们提出了一种系统误差完全受控的格点QCD计算，用于确定π介子标量形状因子及相关半径。计算结果基于17个规范系综的大规模数据集，这些系综采用$N_f=2+1$威尔逊Clover改进海夸克配置，涵盖$0.049\mathrm{fm}$至$0.086\mathrm{fm}$四种晶格间距、$130-350\mathrm{MeV}$的π介子质量范围及多种物理体积。通过精确计算著名的夸克断开贡献，首次在接近物理夸克质量的大尺寸精细系综上实现了形状因子的超高动量分辨率。采用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$的宽范围源汇间距，可靠地提取了零动量转移与非零动量转移下的基态矩阵元。这使得我们首次能通过形状因子$Q^2$依赖性的$z$展开参数化（而非小动量转移下的简单线性近似）获得标量半径。物理外推采用三味NLO手征微扰理论，以三个低能常数（包括$L_4^r$的首个格点测定值）参数化夸克质量依赖性，并通过基于赤池信息准则的模型平均方法量化基态提取、形状因子参数化及物理外推等系统不确定性。

摘要

原文标题：Ion beam treatment of thick polystyrene films
中文标题：厚聚苯乙烯薄膜的离子束处理
发布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分类：physics.chem-ph
原文链接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋涂厚度从78纳米至1.3微米不等的聚苯乙烯薄膜，采用能量为20 keV的氮离子束进行处理。椭偏仪测量和傅里叶变换红外光谱显示，表面改性层的深度与离子在聚合物中的穿透深度（约70纳米）相符。然而，对深层进行清洗及后续测量表明，薄改性层中形成的自由基会迁移至体层，导致深层聚苯乙烯的化学结构发生一系列变化。因此，尽管离子在聚苯乙烯薄膜中的穿透深度较浅，但整个薄膜的改性深度远超过离子的投影射程。由此可见，聚合物离子束处理仅在特定条件下属于表面改性方法，必须考虑自由基反应及其向聚合物深层迁移的可能性。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数极大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：我们研究一维高斯位置混合的非参数极大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定n个数据点时，该估计量始终返回最多含n个分量的混合分布；近期(Wu-Polyanskiy, 2020)更对次高斯数据给出了尖锐的$O(\log n)$界。本文研究$\widehat{\pi}$的计算特性：提出一种算法，当$\varepsilon>0$足够小时，可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算得到$\widehat\pi$的Wasserstein距离$\varepsilon$-近似解。其中$K$依赖数据但独立于$\varepsilon$，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子数。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有密度（相对于Lebesgue测度）的概率分布独立采样生成时，这些保证几乎必然成立。我们还证明：当$k\leq \sqrt{n}/3$时，限定为k原子分布的$\widehat\pi$条件分布在相应$2k-1$维参数空间上存在密度，且EM算法几乎必然具有局部线性收敛性。关键工具之一是对非退化曲线的经典傅里叶分析估计。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子势的大规模长时质子交换膜质子传输原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势（MLIPs）作为一种能够实现大规模、长时间原子模拟并保持与基于密度泛函理论（DFT）和从头算波函数理论的电子结构计算相媲美精度的方法，受到广泛关注。然而，基于MLIP的分子动力学（MD）模拟面临的关键挑战是其稳定性低于传统经典势函数。分析高度异质体系或非晶材料通常需要大规模长时间模拟，这要求开发能够实现稳定MD模拟的鲁棒性MLIP。本研究利用我们的神经网络势（NNP）生成器，构建了一个能在广泛水合水平范围内对全氟离聚物膜（Nafion）进行大规模长时间MD模拟的NNP模型。通过主动学习循环迭代扩展数据集，我们成功建立了鲁棒的深度势（DP）模型。具体而言，通过将非平衡DPMD模拟采样的非平衡结构与融合最小原子间距的三维结构特征空间筛选相结合，可显著提升DP模型的鲁棒性，从而实现对约10,000至20,000原子的大型Nafion体系进行长达31纳秒的稳定MD模拟。采用所开发DP模型的MD模拟获得的氢原子自扩散系数，在广泛水合水平范围内比先前小体系从头算MD模拟结果更接近实验值。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：开放、快速、可靠且高效的每日任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过将地址复制到多个位置来实现（例如）降低延迟和增强韧性。由于任播在现代互联网中的关键作用，先前研究已开发了执行任播普查的工具。首个工具iGreedy利用地理分散位置的延迟测量来绘制任播部署图；第二个工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查，但存在准确性和精确性问题。相反，iGreedy精度极高但速度较慢，且探测成本更高。本文针对这两个系统的缺陷，提出了MAnycast Reloaded（MAnycastR）。以MAnycast2为基础，我们彻底重新设计了其测量流程，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持，以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR，与外部任播生产部署对比，并通过RIPE Atlas进行广泛延迟测量，同时对检测到的60%以上任播前缀进行运营商实地验证交叉检查。结果表明MAnycastR实现了高准确性与精确性。我们将持续提供每日MAnycastR普查数据，并以宽松开源协议发布工具源代码。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：属性图上的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：给定图$G$和种子节点$v_s$，局部图聚类(LGC)的目标是在与$C_s$大小大致成线性关系的时间内，识别出围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图的应用场景。然而现有方案大多仅依赖图中节点的拓扑连接性，容易受到现实图数据中普遍存在的缺失或噪声链接的影响。为解决此问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC建模为双向扩散分布(BDD)的估计问题，该模型专门用于捕捉带属性节点的多跳关联性。进一步提出LACA方法——一种高效且具备严格理论保证的LGC解决方案，在保持强局部性的同时，在多个真实数据集上展现出卓越性能。LACA的核心组件包括：(i) 基于理论基础的快速节点属性预处理技术；(ii) 具有严格理论保证且加速收敛的自适应向量扩散算法；(iii) 高效的三步式BDD近似方案。通过在8个真实数据集上与17种对比方法的实验表明，LACA在真实局部簇标准下的结果质量优于所有对比方法，同时速度可提升数个数量级。代码已开源在https://github.com/HaoranZ99/alac。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重构动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会新陈代谢系统。SCN绝非静态存在，而是通过企业的进出和供应关系的重组持续演变。本研究利用独特数据集追踪了一个国家SCN中企业及其供应商-客户关系的时间演化。基于匈牙利2014至2022年每月增值税数据，我们重建了包含711,248家企业和38,644,400条连接的完整经济网络，以企业级分辨率捕捉了整个经济体的几乎每次重构事件。研究发现：每年约25%的企业退出SCN，同时28%的新企业加入；平均55%的现存供应关系会在次年消失；供应关系的半衰期为13个月。新连接以超偏好依附方式链接企业，概率满足$p(i)\propto k_i^{1.08}$（$k_i$表示企业$i$的连接数）。我们校准的简单统计网络生成模型成功复现了匈牙利主导SCN的典型特征，不仅能重现入/出度分布、同配性和聚类结构等局部特征，还能捕捉真实的系统性风险轮廓。最后探讨了该模型如何通过经济重连动态来量化系统韧性和估计冲击传导。

摘要

原文标题：Ion beam treatment of thick polystyrene films
中文标题：厚聚苯乙烯薄膜的离子束处理
发布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分类：physics.chem-ph
原文链接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋涂厚度从78纳米至1.3微米不等的聚苯乙烯薄膜，采用能量为20 keV的氮离子束进行处理。椭偏仪测量和傅里叶变换红外光谱显示，表面层的改性对应于离子在聚合物中的穿透深度（约70纳米）。然而，对深层进行清洗及后续测量表明，在薄改性层中形成的自由基会迁移至本体层，并导致深层聚苯乙烯化学结构发生一系列变化。因此，尽管离子在聚苯乙烯薄膜中的穿透深度较小，但整个薄膜的改性深度远大于离子的投影射程。由此可见，聚合物离子束处理仅在特定条件下属于表面改性方法，必须考虑自由基反应及其向聚合物深层迁移的可能性。

摘要

原文标题：The Scalar Size of the Pion from Lattice QCD
中文标题：格点QCD中π介子标量大小的计算
发布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分类：hep-lat, hep-ph
原文链接：http://arxiv.org/abs/2503.20687v1

中文摘要：我们提出了一种系统误差完全受控的格点QCD计算，用于确定π介子标量形状因子及相关半径。计算结果基于17组N_f=2+1 威尔逊Clover 改进海夸克的规范系综，这些系综覆盖了从a=0.049fm到a=0.086fm四种格点间距、130-350MeV的π介子质量范围以及多种物理体积。通过对著名的夸克断开贡献的精确测定，我们首次在物理夸克质量附近的大尺度精细系综上实现了形状因子前所未有的动量分辨率。采用1.0fm≲t_sep≲3.25fm的大范围源汇间距，可靠地提取了零动量转移和非零动量转移下的相关基态矩阵元。这使得我们首次能够通过所得形状因子 Q^2依赖性的z-展开参数化（而非小动量转移下的简单线性近似）来获取标量半径。使用三味NLO 手征微扰理论对半径进行物理外推，通过三个低能常数（包括首次格点测定的L_4^r）参数化夸克质量依赖性。基于赤池信息准则的模型平均方法，我们对基态提取、形状因子参数化以及物理外推等环节产生的系统误差进行了量化处理。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数最大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：我们研究一维高斯位置混合的非参数极大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定n个数据点时该估计量总是返回最多含n个分量的混合分布，而近期(Wu-Polyanskiy, 2020)对亚高斯数据给出了精确的$O(\log n)$界。本文研究$\widehat{\pi}$的计算特性：我们提出一种算法，当$\varepsilon>0$足够小时，可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算得到$\widehat\pi$的Wasserstein距离$\varepsilon$-近似解。其中$K$与数据相关但与$\varepsilon$无关，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子数。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有密度函数（相对于Lebesgue测度）的概率分布独立采样生成时，这些保证几乎必然成立。我们还证明：当$k\leq \sqrt{n}/3$时，限定为k原子分布的$\widehat\pi$条件分布在相应$2k-1$维参数空间上存在密度函数，且EM算法几乎必然具有局部线性收敛性。关键工具之一是针对非退化曲线的经典傅里叶分析估计。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势（MLIPs）作为一种能够实现大规模、长时间原子模拟并保持与基于密度泛函理论（DFT）和从头算波函数理论的电子结构计算相当精度的方法，受到了广泛关注。然而，基于MLIP的分子动力学（MD）模拟面临的挑战是其稳定性低于传统经典势函数。分析高度异质体系或非晶材料通常需要大规模长时间模拟，因此必须开发能够实现稳定MD模拟的鲁棒性MLIPs。本研究利用我们的神经网络势（NNP）生成器，构建了一个能够在广泛水合水平范围内对全氟离聚物膜（Nafion）进行大规模长时间MD模拟的NNP模型。通过主动学习循环迭代扩展数据集，我们成功建立了鲁棒的深度势（DP）模型。具体而言，通过将非平衡DPMD模拟采样的非平衡结构与结合最小原子间距的三维结构特征空间筛选相结合，可显著提升DP模型的鲁棒性，从而实现对约10,000至20,000原子的大型Nafion体系进行长达31纳秒的稳定MD模拟。采用所开发DP模型的MD模拟获得的氢原子自扩散系数，在广泛水合水平范围内比先前小体系从头算MD模拟结果更接近实验值。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：一个开放、快速、可靠且高效的每日任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过将地址复制到多个位置来实现（例如）降低延迟和增强韧性。由于任播在现代互联网中的关键作用，先前研究已开发了执行任播普查的工具。首个工具iGreedy利用地理分散位置的延迟测量来映射任播部署；第二个工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查，但存在准确性和精确性问题。相反，iGreedy精度极高但速度较慢，且探测成本更高。本文针对这两个系统的缺陷，提出了MAnycast Reloaded（MAnycastR）。以MAnycast2为基础，我们彻底重新设计了其测量管道，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持，以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR，与外部任播生产部署对比，并通过RIPE Atlas进行广泛延迟测量，同时将检测到的60%以上任播前缀与运营商真实数据交叉核验。结果表明MAnycastR实现了高准确性与精确度。我们以宽松开源协议向社区提供每日持续的MAnycastR普查数据，并公开该工具的源代码。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：基于属性图的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：给定图$G$和种子节点$v_s$，局部图聚类（LGC）的目标是在与$C_s$大小大致成线性关系的时间内，识别出围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图的应用场景。然而，现有解决方案大多仅依赖图中节点的拓扑连接性，容易受到现实图数据中普遍存在的缺失或噪声链接的影响。为解决该问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC问题建模为双向扩散分布（BDD）的估计问题，该模型专门用于捕捉含属性图中节点的多跳关联性。进一步提出LACA方法——一种高效且具备强局部性的LGC解决方案，在多个真实数据集上表现出卓越性能。其核心组件包括：（i）基于理论基础的快速节点属性预处理技术；（ii）具备严格理论保证和加速收敛特性的自适应向量扩散算法；（iii）高效的三步式BDD近似方案。通过在8个真实数据集上与17种对比方法的实验表明，LACA在真实局部簇的评估指标上全面优于所有对比方法，同时速度提升达数量级。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重构动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会新陈代谢系统。SCN绝非静态存在，而是通过企业的进出与供应关系的重组持续演变。本研究利用独特数据集追踪了一个国家SCN中企业及其供需关系的时序演化。基于匈牙利2014至2022年每月增值税数据，我们重建了包含711,248家企业和38,644,400条连接的整体经济网络，实现了企业级分辨率的经济结构全息记录。研究发现：每年约25%企业退出SCN，同时28%新企业进入；平均55%的年度供应关系会在次年消失；供应关系的半衰期为13个月。新连接以超偏好依附概率$p(i)\propto k_i^{1.08}$（$k_i$为企业i的连接数）形成。我们校准的简易统计网络生成模型成功复现了匈牙利主导SCN的典型特征，不仅能再现入/出度分布、同配性和聚类结构等局部特征，还能捕捉真实的系统性风险轮廓。最后探讨了经济网络重连动力学对量化系统韧性和估计冲击传导的关键作用。

摘要

原文标题：Ion beam treatment of thick polystyrene films
中文标题：厚聚苯乙烯薄膜的离子束处理
发布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分类：physics.chem-ph
原文链接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋涂厚度为78纳米至1.3微米的不同厚度聚苯乙烯薄膜，采用能量为20 keV的氮离子束进行处理。椭偏仪测量和傅里叶变换红外光谱显示，表面层的改性对应于离子在聚合物中的穿透深度（约70纳米）。然而，对深层进行清洗和后续测量表明，在薄改性层中形成的自由基会迁移到本体层中，并导致深层聚苯乙烯层的化学结构发生一系列变化。因此，尽管离子在聚苯乙烯薄膜中的穿透深度较小，但整个薄膜的改性深度远大于离子的投影射程。因此，离子束处理聚合物仅在特定条件下可视为表面改性方法。必须考虑自由基反应及其向聚合物深层迁移的可能性。

摘要

原文标题：The Scalar Size of the Pion from Lattice QCD
中文标题：格点QCD中π介子标量大小的计算
发布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分类：hep-lat, hep-ph
原文链接：http://arxiv.org/abs/2503.20687v1

中文摘要：我们提出了一种系统误差完全受控的格点QCD计算，用于确定π介子标量形状因子及相关半径。计算结果基于17个规范场组态的大规模集合，采用$N_f=2+1$ Wilson-Clover改进海夸克。这些组态覆盖了从$a=0.049\mathrm{fm}$到$a=0.086\mathrm{fm}$四种格距，$130-350\mathrm{MeV}$的π介子质量范围以及多种物理体积。通过对著名的夸克不连通贡献的精确测定，我们首次在接近物理夸克质量的大尺寸精细组态上实现了形状因子前所未有的动量分辨率。采用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$范围内多种源汇间距，可靠地提取了零动量转移和非零动量转移下的基态矩阵元。这使得我们能够首次通过所得形状因子$Q^2$依赖性的$z$展开参数化（而非小动量转移下的简单线性近似）获取标量半径。半径的物理外推采用三味NLO手征微扰理论，以三个低能常数（包括$L_4^r$的首次格点测定结果）参数化夸克质量依赖性。通过基于赤池信息准则的模型平均方法，系统评估了基态提取、形状因子参数化以及物理外推对最终结果的系统不确定性。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数极大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：我们研究一维高斯位置混合的非参数最大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定n个数据点，该估计量总是返回最多含n个分量的混合分布；近期(Wu-Polyanskiy, 2020)对次高斯数据给出了精确的$O(\log n)$界。本文研究$\widehat{\pi}$的计算特性：我们提出一种算法，当$\varepsilon>0$足够小时，可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算Wasserstein距离下的$\varepsilon$近似解，其中$K$与数据相关但与$\varepsilon$无关，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$是$\widehat\pi$的原子数。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$来自具有密度（相对于Lebesgue测度）的概率分布时，这些保证几乎必然成立。我们还证明：当$k\leq \sqrt{n}/3$时，限定为k原子分布的$\widehat\pi$在相关$2k-1$维参数空间上具有密度，且EM算法几乎必然局部线性收敛。关键工具之一是非退化曲线的经典傅里叶分析估计。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子间势的聚合物电解质膜质子传输大规模长时原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势（MLIPs）作为一种能够实现大规模、长时间原子模拟的方法备受关注，同时保持与基于密度泛函理论（DFT）和从头算波函数理论的电子结构计算相当的精度。然而，基于MLIP的分子动力学（MD）模拟面临的挑战是其稳定性低于使用传统经典势的模拟。分析高度异质系统或无定形材料通常需要大规模和长时间的模拟，因此需要开发能够进行稳定MD模拟的鲁棒MLIPs。在本研究中，我们利用神经网络势（NNP）生成器，构建了一个NNP模型，能够在广泛水合水平范围内对全氟离子交换膜（Nafion）进行大规模、长时间的MD模拟。通过主动学习循环迭代扩展数据集，我们成功构建了一个鲁棒的深度势（DP）模型。具体而言，通过结合非平衡DPMD模拟采样的非平衡结构与包含最小原子间距离的3D结构特征空间中的结构筛选，可以显著增强DP模型的鲁棒性，从而实现对大约10,000至20,000个原子的大型Nafion系统进行长达31 ns的稳定MD模拟。采用所开发DP模型的MD模拟得到的氢原子自扩散系数，在广泛水合水平范围内与实验值更为接近，优于先前对小系统进行的从头算MD模拟结果。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：一个开放、快速、可靠且高效的每日任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过将地址复制到多个位置来实现降低延迟和增强韧性等目标。由于任播在现代互联网中的关键作用，先前研究已开发了多种任播普查工具。首款工具iGreedy通过地理分散位置的延迟测量来绘制任播部署图；第二款工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度，可在3小时内完成全网普查，但存在准确性和精确度问题。相反，iGreedy精度极高但速度较慢，且探测成本更高。本文针对这两个系统的缺陷提出了MAnycast Reloaded（MAnycastR）。以MAnycast2为基础，我们彻底重构了其测量流程，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR，与外部任播生产部署进行对比，并通过RIPE Atlas进行广泛延迟测量，同时针对60%以上检测到的任播前缀与运营商真实数据进行交叉验证。结果表明MAnycastR实现了高准确性和精确度。我们将持续提供每日MAnycastR普查数据，并以宽松开源协议发布工具源代码。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：基于属性图的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：给定图$G$和种子节点$v_s$，局部图聚类（LGC）的目标是在与$C_s$大小大致成线性关系的时间内，识别出围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图的应用场景。然而，现有解决方案大多仅依赖图中节点的拓扑连接性，容易受到现实图数据中普遍存在的缺失或噪声链接的影响。为解决该问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC建模为双向扩散分布（BDD）的估计问题，该模型专门用于捕捉带属性节点的多跳关联性。进一步提出LACA方法——一种高效且具备严格理论保证的LGC算法，其核心包括：(i) 基于理论基础的快速节点属性预处理技术，(ii) 具有自适应扩散能力且保证加速收敛的向量传播算法，(iii) 高效的三步式BDD近似方案。在8个真实数据集上与17种对比方法的实验表明，LACA在真实局部簇的评估指标上全面优于所有基线方法，同时实现数量级的速度提升。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重构动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会新陈代谢系统。供应链网络绝非静态，而是通过企业的进出和供应关系的重组不断变化。本文利用独特数据集研究了一个国家供应链网络中企业及其供应商-买方关系的时间演化。基于匈牙利2014至2022年每月申报的增值税数据，我们重建了包含711,248家企业和38,644,400条连接的整体经济网络，以企业级分辨率覆盖了几乎所有的经济重构事件。研究发现：每年约25%的企业退出供应链网络，同时28%的新企业加入；平均55%的现存供应链接会在次年消失；供应链接的半衰期为13个月。新链接以超偏好依附方式连接企业，概率满足$p(i)\propto k_i^{1.08}$（$k_i$表示企业$i$的供应连接数）。我们校准了一个能复现匈牙利主导供应链网络典型特征的简单统计网络生成模型，该模型不仅复现了入/出度分布、同配性和聚类结构等局部网络特征，还捕捉了真实的系统性风险特征。最后讨论了该模型如何通过经济网络的重连动态来量化其韧性并评估冲击传播。

摘要

原文标题：Ion beam treatment of thick polystyrene films
中文标题：厚聚苯乙烯薄膜的离子束处理
发布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分类：physics.chem-ph
原文链接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋涂厚度为78纳米至1.3微米的不同厚度聚苯乙烯薄膜，并用能量为20 keV的氮离子进行处理。椭圆偏振测量和傅里叶变换红外光谱显示，表面层的改性对应于离子在聚合物中的穿透深度（约70纳米）。然而，对深层进行清洗和后续测量表明，在薄改性层中形成的自由基迁移到体层中，并引起深层聚苯乙烯化学结构的多种变化。因此，尽管离子在聚苯乙烯薄膜中的穿透深度较小，但整个薄膜的改性深度远大于离子的投影射程。因此，离子束处理聚合物仅在特定条件下是一种表面改性方法。必须考虑自由基反应及其向聚合物深层迁移的可能性。

摘要

原文标题：The Scalar Size of the Pion from Lattice QCD
中文标题：格点QCD中π介子的标量大小
发布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分类：hep-lat, hep-ph
原文链接：http://arxiv.org/abs/2503.20687v1

中文摘要：我们提出了一种系统误差完全受控的格点QCD计算，用于确定π介子标量形状因子及相关半径。计算结果基于17个规范系综的大规模数据集，这些系综采用$N_f=2+1$ Wilson Clover改进的海夸克配置。这些系综覆盖了从$a=0.049\mathrm{fm}$到$a=0.086\mathrm{fm}$的四种格点间距、$130-350\mathrm{MeV}$的π介子质量范围以及多种物理体积。通过精确计算著名的夸克断开贡献，我们首次在接近物理夸克质量的大尺寸精细系综上实现了形状因子前所未有的动量分辨率。采用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$的宽范围源汇分离距离，可靠地提取了零动量转移和非零动量转移下的基态矩阵元。这使得我们能够首次通过所得形状因子$Q^2$依赖性的$z$展开参数化（而非小动量转移下的简单线性近似）获得标量半径。半径的物理外推采用三味NLO手征微扰理论，以三个低能常数（包括$L_4^r$的首个格点测定值）参数化夸克质量依赖性。通过基于赤池信息准则的模型平均方法，系统评估了基态提取、形状因子参数化以及物理外推对最终结果的系统不确定性影响。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数最大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：我们研究一维高斯位置混合模型的非参数极大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定包含$n$个数据点的数据集，该估计量总是返回最多包含$n$个分量的混合模型；而近期(Wu-Polyanskiy, 2020)对次高斯数据给出了严格的$O(\log n)$界。本文重点研究$\widehat{\pi}$的计算特性：我们提出一种算法，当$\varepsilon>0$足够小时，可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算出Wasserstein距离意义上的$\varepsilon$近似解$\widehat\pi$。其中$K$与数据相关但与$\varepsilon$无关，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子数量。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$中的点独立采样自具有（相对于勒贝格测度的）密度函数的概率分布时，这些保证几乎必然成立。我们还证明：当$k\leq \sqrt{n}/3$时，限定为$k$原子结构的$\widehat\pi$条件分布在相关$2k-1$维参数空间上具有密度函数，且EM算法几乎必然具有局部线性收敛性。其中关键工具是非退化曲线的经典傅里叶分析估计。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势（MLIPs）作为一种能够实现大规模、长时间原子模拟的方法受到广泛关注，其精度可与基于密度泛函理论（DFT）和从头算波函数理论的电子结构计算相媲美。然而，基于MLIP的分子动力学（MD）模拟存在稳定性低于传统经典势函数的挑战。分析高度异质体系或非晶材料通常需要大规模长时间模拟，因此必须开发能够实现稳定MD模拟的鲁棒性 MLIP。本研究利用我们的神经网络势（NNP）生成器，构建了一个NNP模型，可在广泛水合水平范围内对全氟离聚物膜（Nafion）进行大规模长时间MD模拟。通过主动学习循环迭代扩展数据集，我们成功建立了鲁棒的深度势（DP）模型。具体而言，通过将非平衡 DPMD模拟采样的非平衡结构与结合最小原子间距的三维结构特征空间筛选相结合，可显著增强DP模型的鲁棒性，从而实现对约10,000至20,000原子的大型Nafion体系进行长达31 ns的稳定MD模拟。采用所开发DP模型的MD模拟获得的氢原子自扩散系数，在广泛水合水平范围内比先前小体系从头算 MD模拟结果更接近实验值。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：开放、快速、可靠且高效的每日任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过将地址复制到多个位置来实现降低延迟和增强韧性等目标。由于任播在现代互联网中的关键作用，先前研究已开发了多种任播普查工具。首款工具iGreedy通过地理分散节点的延迟测量来绘制任播部署图；第二款工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查，但存在准确性和精确度问题；而iGreedy虽然高度准确，但速度较慢且探测成本更高。本文针对这两个系统的缺陷提出了MAnycast Reloaded（MAnycastR）。我们在MAnycast2基础上完全重构了其测量管道，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持以及类似iGreedy的延迟测量功能。通过在含32个全球分布式节点的任播测试平台进行验证，与外部任播生产部署对比，结合RIPE Atlas的广泛延迟测量，并对检测到的60%以上任播前缀进行运营商数据交叉核验，证明MAnycastR具备高准确性和精确度。我们将持续提供每日MAnycastR普查数据，并以宽松开源协议发布工具源代码。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：基于属性图的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：给定图$G$和种子节点$v_s$，局部图聚类(LGC)的目标是在与$C_s$大小大致成线性关系的时间内，识别出围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图的应用场景。然而，现有解决方案大多仅依赖图中节点的拓扑连接性，容易受到现实图数据中普遍存在的缺失链接或噪声链接的影响。为解决这一问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC建模为双向扩散分布(BDD)的估计问题，该模型专门用于捕捉带属性节点的多跳关联性。进一步提出LACA方法——一种高效且具备强局部性的LGC解决方案，在多个真实数据集上表现出卓越性能。其核心组件包括：(i) 基于理论基础的快速节点属性预处理技术；(ii) 具有严格理论保证和加速收敛特性的自适应向量扩散算法；(iii) 高效的三步式BDD近似方案。通过在8个真实数据集上与17种对比方法的实验表明，LACA在真实局部簇的评估指标上全面优于所有对比方法，同时速度提升可达数量级。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重构动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会新陈代谢系统。供应链网络绝非静态存在，而是通过企业的进出和供应关系的重组不断变化。本文利用独特数据集研究了一个国家供应链网络中企业及其供应商-客户关系的时间演化。基于匈牙利2014至2022年每月报告的增值税数据，我们重建了包含711,248家企业和38,644,400条连接的整体经济网络，以企业级分辨率覆盖了几乎整个经济体的所有重构事件。研究发现：每年约25%的企业退出供应链网络，同时28%的新企业加入；平均而言，当年存在的供应链接中有55%会在次年消失；供应链接的半衰期为13个月。新链接以超偏好依附概率$p(i)\propto k_i^{1.08}$（$k_i$表示企业i的供应连接数）附着于企业。我们校准了一个能复现匈牙利主导供应链网络典型特征的简单统计网络生成模型，该模型不仅复现了入/出度分布、同配性和聚类结构等局部网络特征，还捕捉了真实的系统性风险特征。最后讨论了当前模型如何通过经济重连动态来量化其韧性并估计冲击传导。

摘要

原文标题：Ion beam treatment of thick polystyrene films
中文标题：厚聚苯乙烯薄膜的离子束处理
发布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分类：physics.chem-ph
原文链接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋涂厚度从78纳米至1.3微米不等的聚苯乙烯薄膜，经20 keV 氮离子束处理后，椭偏仪测量和傅里叶变换红外光谱显示表面改性层深度与离子在聚合物中的穿透深度（约70纳米）相符。然而，深层洗涤及后续测试表明，薄改性层中形成的自由基会迁移至本体层，导致深层聚苯乙烯发生一系列化学结构变化。因此，尽管离子在聚苯乙烯薄膜中的穿透深度有限，整个薄膜的改性深度却远超过离子投影射程。这表明离子束处理仅能有条件地视为表面改性方法，必须考虑自由基反应及其向聚合物深层迁移的可能性。

摘要

原文标题：The Scalar Size of the Pion from Lattice QCD
中文标题：格点QCD中π介子的标量大小
发布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分类：hep-lat, hep-ph
原文链接：http://arxiv.org/abs/2503.20687v1

中文摘要：我们提出了一种系统误差完全受控的格点QCD计算，用于确定π介子标量形状因子及相关半径。计算结果基于17组Nf=2+1 威尔逊-克拉夫改进海夸克的规范系综，涵盖0.049-0.086fm四种晶格间距、130-350MeVπ介子质量范围及多种物理体积。通过对著名夸克断开贡献的精确测定，首次在接近物理夸克质量的大尺寸精细系综上实现了形状因子前所未有的动量分辨率。采用1.0-3.25fm宽范围的源汇分离距离，可靠地提取了零动量转移与非零动量转移下的基态矩阵元。这使得我们首次能通过所得形状因子Q²依赖性的z-展开参数化（而非小动量转移下的简单线性近似）获取标量半径。使用三味NLO 手征微扰理论对半径进行物理外推，以三个低能常数（包括L₄ʳ的首个格点测定值）参数化夸克质量依赖性。通过基于赤池信息准则的模型平均，量化了基态提取、形状因子参数化及物理外推等环节对最终结果的系统不确定性。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数极大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：摘要：我们研究一维高斯位置混合的非参数最大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定n个数据点，该估计量总是返回最多含n个分量的混合分布，而近期(Wu-Polyanskiy, 2020)对次高斯数据给出了严格的$O(\log n)$界。本文研究$\widehat{\pi}$的计算特性：提出一种算法，当$\varepsilon>0$足够小时，可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算Wasserstein距离下的$\varepsilon$近似解，其中$K$依赖数据但独立于$\varepsilon$，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$是$\widehat\pi$的原子数。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$来自具有密度（相对于Lebesgue测度）的概率分布时，这些保证几乎必然成立。我们还证明：当$k\leq \sqrt{n}/3$时，限定为k原子分布的$\widehat\pi$在相关$2k-1$维参数空间上具有密度，且EM算法几乎必然局部线性收敛。关键工具之一是非退化曲线的经典傅里叶分析估计。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势（MLIPs）作为一种能够实现大规模、长时间原子尺度模拟的方法，同时保持与基于密度泛函理论（DFT）和从头算波函数理论的电子结构计算相当的精度，引起了广泛关注。然而，基于MLIP的分子动力学（MD）模拟面临的挑战是其稳定性低于使用传统经典势的模拟。分析高度异质体系或非晶材料通常需要大规模和长时间的模拟，因此必须开发能够进行稳定MD模拟的鲁棒MLIP。在本研究中，我们利用自研的神经网络势（NNP）生成器，构建了一个NNP模型，能够对全氟离聚物膜（Nafion）在不同水合水平下进行大规模、长时间的MD模拟。通过主动学习循环迭代扩展数据集，我们成功建立了鲁棒的深度势（DP）模型。具体而言，通过将非平衡 DPMD模拟采样的非平衡结构与结合最小原子间距的三维结构特征空间中的结构筛选相结合，可显著提升DP模型的鲁棒性，从而实现对约10,000至20,000个原子的大型Nafion体系进行长达31 ns的稳定MD模拟。采用所开发DP模型的MD模拟获得的氢原子自扩散系数，在广泛水合水平范围内比先前小体系从头算MD模拟结果更接近实验值。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：开放、快速、可靠且高效的每日任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过将地址复制到多个位置来实现降低延迟和增强韧性等目标。由于任播在现代互联网中的关键作用，先前研究已开发了执行任播普查的工具。首个工具iGreedy利用地理分散位置的延迟测量来绘制任播部署图；第二个工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查，但存在准确性和精确度问题。相反，iGreedy精度极高但速度较慢，且探测成本更高。本文针对这两个系统的缺陷提出了MAnycast Reloaded（MAnycastR）。以MAnycast2为基础，我们彻底重新设计了其测量流水线，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持以及类似iGreedy的延迟测量功能。我们在包含32个全球分布式节点的任播测试平台上验证MAnycastR，与外部任播生产部署进行对比，并通过RIPE Atlas进行广泛延迟测量，同时对检测到的60%以上任播前缀与运营商真实数据进行交叉验证。结果表明MAnycastR实现了高准确性和精确度。我们以宽松的开源许可向社区提供每日持续的MAnycastR普查数据，并发布该工具的源代码。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：基于属性图的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：给定图$G$和种子节点$v_s$，局部图聚类（LGC）的目标是在与$C_s$大小大致成线性关系的时间内，识别出围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图的应用场景。然而，现有解决方案大多仅依赖图中节点的拓扑连接性，容易受到现实图数据中普遍存在的缺失或噪声链接的影响。为解决该问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC建模为双向扩散分布（BDD）的估计问题，该模型专门用于捕捉带属性节点的多跳关联性。进一步提出LACA方法——一种高效且具备严格理论保证的LGC 算法，其核心包括：(i) 快速且理论完备的节点属性预处理技术；(ii) 具有自适应扩散能力和加速收敛特性的向量传播算法；(iii) 高效的三步式 BDD 近似方案。在8个真实数据集上与17种基线方法的对比实验表明，LACA在真实局部簇的评估指标上全面优于所有对比方法，同时速度提升达数量级。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重连动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成了任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会新陈代谢系统。供应链网络绝非静态存在，而是通过企业的进出和供应关系的重组不断变化。本研究利用独特数据集追踪了一个国家供应链网络中企业及其供应商-客户关系的时间演化。基于匈牙利2014至2022年每月报告的增值税数据，我们重建了包含711,248家企业和38,644,400条连接的整体经济网络，以企业级分辨率覆盖了几乎整个经济体的所有重构事件。研究发现：每年约25%的企业退出供应链网络，同时28%的新企业加入；平均55%的现存供应链接会在次年消失；供应链接的半衰期为13个月。新链接以超偏好依附概率$p(i)\propto k_i^{1.08}$（$k_i$表示企业i的供应连接数）附着于企业。我们校准了一个能复现匈牙利主导供应链网络典型特征的简单统计网络生成模型，该模型不仅复现了入/出度分布、同配性和聚类结构等局部网络特征，还捕捉了真实的系统性风险特征。最后讨论了当前模型如何通过经济重连动态来量化系统韧性和估计冲击传导。

摘要

原文标题：Ion beam treatment of thick polystyrene films
中文标题：厚聚苯乙烯薄膜的离子束处理
发布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分类：physics.chem-ph
原文链接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋涂厚度为78纳米至1.3微米的不同厚度聚苯乙烯薄膜，并用能量为20 keV的氮离子进行处理。椭偏仪测量和傅里叶变换红外光谱显示，表面层的改性对应于离子在聚合物中的穿透深度（约70纳米）。然而，对深层进行清洗和后续测量表明，在薄改性层中形成的自由基会迁移到本体层中，并引起深层聚苯乙烯层化学结构的多种变化。因此，尽管离子在聚苯乙烯薄膜中的穿透深度较小，但整个薄膜的改性深度远大于离子的投影射程。因此，离子束处理聚合物仅在特定条件下是一种表面改性方法。必须考虑自由基反应及其向聚合物深层迁移的可能性。

摘要

原文标题：The Scalar Size of the Pion from Lattice QCD
中文标题：格点QCD中π介子的标量大小
发布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分类：hep-lat, hep-ph
原文链接：http://arxiv.org/abs/2503.20687v1

中文摘要：我们提出了一种系统误差完全受控的格点QCD计算，用于确定π介子标量形状因子及相关半径。计算结果基于包含17个规范系综的大规模数据集，这些系综采用$N_f=2+1$威尔逊Clover改进海夸克。所涉系综覆盖$0.049\mathrm{fm}$至$0.086\mathrm{fm}$四种格距、$130-350\mathrm{MeV}$的π介子质量范围及多种物理体积。通过精确计算著名的夸克断开贡献，首次在接近物理夸克质量的大尺寸精细系综上实现了形状因子前所未有的动量分辨率。采用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$的大范围源汇间距，可靠地提取了零动量转移与非零动量转移下的基态矩阵元。这使得我们首次能通过所得形状因子$Q^2$依赖性的$z$展开参数化（而非小动量转移下的简单线性近似）获取标量半径。半径的物理外推采用三味NLO手征微扰理论，以三个低能常数（包括$L_4^r$的首个格点测定值）参数化夸克质量依赖性。通过基于赤池信息准则的模型平均方法，系统评估了基态提取、形状因子参数化及物理外推等环节对最终结果的系统不确定性。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数最大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：我们研究一维高斯位置混合的非参数极大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定n个数据点时，该估计量始终返回最多含n个分量的混合分布；近期(Wu-Polyanskiy, 2020)更对次高斯数据给出了严格的$O(\log n)$界。本文重点研究$\widehat{\pi}$的计算特性：我们提出一种算法，当$\varepsilon>0$足够小时，可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算出Wasserstein距离意义上的$\varepsilon$近似解，其中$K$与数据相关但与$\varepsilon$无关，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子数。我们还可在有限时间内确定性计算出$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$中的点独立采样自具有Lebesgue测度密度的概率分布时，这些保证几乎必然成立。我们进一步证明：当$k\leq \sqrt{n}/3$时，限定为k原子分布的$\widehat\pi$条件分布在相应$2k-1$维参数空间上存在密度，且EM算法几乎必然具有局部线性收敛性。关键工具之一是对非退化曲线的经典傅里叶分析估计。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子势的大规模长时质子交换膜质子传输原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势（MLIPs）作为一种能够实现大规模、长时间原子尺度模拟的方法，同时保持与基于密度泛函理论（DFT）和从头算波函数理论的电子结构计算相当的精度，引起了广泛关注。然而，基于MLIP的分子动力学（MD）模拟面临的挑战是其稳定性低于使用传统经典势的模拟。分析高度异质体系或非晶材料通常需要大规模和长时间的模拟，因此需要开发能够实现稳定MD模拟的鲁棒MLIP。在本研究中，我们利用自研的神经网络势（NNP）生成器，构建了一个NNP模型，该模型能够对全氟磺酸离子膜（Nafion）在不同水合水平下进行大规模、长时间的MD模拟。通过主动学习循环迭代扩展数据集，我们成功建立了鲁棒的深度势（DP）模型。具体而言，通过将非平衡DPMD模拟采样的非平衡结构与结合最小原子间距的三维结构特征空间中的结构筛选相结合，可显著提升DP模型的鲁棒性，从而实现对约10,000至20,000个原子的大型Nafion体系进行长达31 ns的稳定MD模拟。采用所开发DP模型的MD模拟获得的氢原子自扩散系数，在广泛水合水平范围内比先前小体系从头算MD模拟结果更接近实验值。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：开放、快速、可靠且高效的每日任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过将地址复制到多个位置来实现（例如）降低延迟和增强韧性。由于任播在现代互联网中的关键作用，先前研究已开发了执行任播普查的工具。首个工具iGreedy利用地理分散位置的延迟测量来映射任播部署；第二个工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查，但存在准确性和精确性问题。相反，iGreedy精度极高但速度较慢，且探测成本更高。本文针对这两个系统的缺陷，提出了MAnycast Reloaded（MAnycastR）。我们以MAnycast2为基础，彻底重构其测量流程，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持，以及类似iGreedy的延迟测量功能。通过在含32个全球分布式节点的任播测试床上验证MAnycastR，与外部任播生产部署对比，结合RIPE Atlas的广泛延迟测量，并对检测到的任播前缀中超过60%进行运营商真实数据交叉验证，结果表明MAnycastR实现了高准确性与精确度。我们将持续提供每日MAnycastR普查数据，并以宽松开源协议发布工具源代码。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：基于属性图的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：给定图$G$和种子节点$v_s$，局部图聚类（LGC）的目标是在与$C_s$大小近似线性相关的时间内，识别出围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图的应用场景。然而现有方案大多仅依赖图中节点的拓扑连接性，容易受到现实图谱中普遍存在的缺失链接或噪声链接的影响。为解决该问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC建模为双向扩散分布（BDD）的估计问题，该模型专门用于捕捉含属性节点间的多跳亲和力。进一步提出LACA方法——一种高效且具备严格理论保证的LGC方案，其核心组件包括：(i) 基于理论基础的快速节点属性预处理技术；(ii) 具有理论保证和加速收敛特性的自适应向量扩散算法；(iii) 高效的三步式BDD近似方案。在8个真实数据集上与17种对比方法的实验表明，LACA在真实局部簇的衡量标准下均优于所有对比方法，同时速度提升达数量级。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重连动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成了任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会新陈代谢系统。供应链网络绝非静态存在，而是通过企业的进入退出与供应关系的重组持续演变。本研究利用独特数据集追踪了一个国家供应链网络中企业及其供应商-客户关系的时间演化。基于匈牙利2014至2022年按月申报的增值税数据，我们重建了包含711,248家企业和38,644,400条连接的整体经济网络，以企业级分辨率覆盖了几乎所有的经济结构调整事件。研究发现：每年约25%的企业退出供应链网络，同时28%的新企业加入；平均而言，当年存在的供应链接中有55%会在次年消失；供应链接的半衰期为13个月。新链接以超偏好依附方式连接企业，概率满足$p(i)\propto k_i^{1.08}$（$k_i$表示企业$i$的供应连接数）。我们校准了一个能复现匈牙利主导供应链网络典型特征的简易统计网络生成模型，该模型不仅再现了入/出度分布、同配性和聚类结构等局部网络特征，还捕捉到真实的系统性风险轮廓。最后探讨了经济重连动态对量化系统韧性和估计冲击传导的关键作用。

摘要

原文标题：Ion beam treatment of thick polystyrene films
中文标题：厚聚苯乙烯薄膜的离子束处理
发布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分类：physics.chem-ph
原文链接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋涂厚度为78 nm至1.3 μm的聚苯乙烯薄膜经20 keV氮离子束处理后，椭偏仪测量和傅里叶变换红外光谱显示表面改性层深度与离子在聚合物中的穿透深度（约70 nm）相符。然而，深层洗涤及后续测试表明，薄改性层中形成的自由基会迁移至本体层，导致深层聚苯乙烯化学结构发生系列变化。因此，尽管离子在聚苯乙烯膜中的穿透深度较浅，但整个薄膜的改性深度远超离子投影射程。这表明离子束处理聚合物仅能视作表面改性方法是有条件的，必须考虑自由基反应及其向聚合物深层迁移的可能性。

摘要

原文标题：The Scalar Size of the Pion from Lattice QCD
中文标题：格点QCD中π介子的标量大小
发布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分类：hep-lat, hep-ph
原文链接：http://arxiv.org/abs/2503.20687v1

中文摘要：我们提出了一种系统误差完全受控的格点QCD计算，用于确定π介子标量形状因子及相关半径。计算结果基于17组Nf=2+1 威尔逊Clover 改进海夸克的规范系综，这些系综覆盖了0.049-0.086fm四种晶格间距、130-350MeV的π介子质量范围及多种物理体积。通过对著名夸克断开贡献的精确测定，首次在接近物理夸克质量的大尺寸精细系综上实现了形状因子前所未有的动量分辨率。采用1.0-3.25fm宽范围的源汇分离距离，可靠地提取了零动量转移和非零动量转移下的基态矩阵元。这使得我们首次能通过形状因子 Q²依赖性的z展开参数化（而非小动量转移下的简单线性近似）获得标量半径。使用三味 NLO 手征微扰理论对半径进行物理外推，以三个低能常数（包括L₄ʳ的首个格点测定结果）参数化夸克质量依赖性。通过基于赤池信息准则的模型平均方法，系统评估了基态提取、形状因子参数化及物理外推等环节对最终结果的系统不确定性。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数极大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：我们研究一维高斯位置混合模型的非参数最大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定n个数据点时，该估计量始终返回最多含n个分量的混合模型；而近期(Wu-Polyanskiy, 2020)对亚高斯数据给出了严格的$O(\log n)$界。本文重点研究$\widehat{\pi}$的计算特性：我们提出的算法能在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算出Wasserstein距离意义下的$\varepsilon$近似解，其中$K$与数据相关但与$\varepsilon$无关，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子数。我们还可在有限时间内精确计算$|supp(\widehat\pi)|$值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$来自具有密度（相对于Lebesgue测度）的概率分布时，这些保证几乎必然成立。我们还证明：当$k\leq \sqrt{n}/3$时，限定为k原子型的$\widehat\pi$条件分布在相关$2k-1$维参数空间上存在密度，且EM算法几乎必然具有局部线性收敛性。关键工具之一是非退化曲线的经典傅里叶分析估计。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子势的大规模长时质子交换膜质子传输原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势（MLIPs）作为一种能够实现大规模、长时间原子模拟并保持与基于密度泛函理论（DFT）和从头算波函数理论的电子结构计算相当精度的方法，受到广泛关注。然而，基于MLIP的分子动力学（MD）模拟相较于传统经典势的模拟稳定性较低。分析高度异质体系或非晶材料通常需要大规模长时间模拟，因此亟需开发能够实现稳定MD模拟的鲁棒性 MLIPs。本研究利用我们的神经网络势（NNP）生成器，构建了一个能够在广泛水合水平下对全氟离聚物膜（Nafion）进行大规模长时间MD模拟的NNP模型。通过主动学习循环迭代扩展数据集，我们成功建立了鲁棒的深度势（DP）模型。具体而言，通过结合非平衡DPMD模拟的非平衡结构采样与包含最小原子间距的三维结构特征空间中的结构筛选，可显著增强DP模型的鲁棒性，从而实现对约10,000至20,000原子的大型Nafion体系进行长达31 ns的稳定MD模拟。采用所开发DP模型的MD模拟获得的氢原子自扩散系数，在广泛水合水平范围内比先前较小体系的从头算MD模拟更接近实验值。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：开放、快速、可靠且高效的每日任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过在多位置复制地址来降低延迟并增强韧性。鉴于任播在现代互联网中的关键作用，早期研究已开发出多种任播普查工具。首款工具iGreedy通过地理分散的延迟测量来绘制任播部署图；第二款工具MAnycast2则利用任播技术对其他任播网络进行普查，其优势在于3小时内即可完成全网普查，但存在准确性和精度问题。反观iGreedy虽精度极高但速度较慢，且探测成本显著更高。本文针对两套系统的缺陷，提出升级版MAnycast Reloaded（MAnycastR）。我们在MAnycast2基础上彻底重构了测量管道，新增分布式探测支持、多协议（UDP/TCP/IPv6）兼容性以及类iGreedy的延迟测量功能。通过在含32个全球分布式节点的任播测试床进行验证，与真实任播部署对比测试，并利用RIPE Atlas进行大规模延迟测量交叉检验（其中60%以上检测到的任播前缀通过运营商数据复核），证明MAnycastR具备高准确性与精确度。我们将持续提供每日任播普查数据，并以宽松开源协议发布工具源代码。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：基于属性图的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：给定图$G$和种子节点$v_s$，局部图聚类（LGC）的目标是在与$C_s$大小大致成线性关系的时间内，识别出围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图的应用场景。然而，现有解决方案大多仅依赖图中节点的拓扑连接性，容易受到现实图数据中普遍存在的缺失或噪声链接的影响。为解决该问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC建模为双向扩散分布（BDD）的估计问题，该模型专门用于捕捉带属性节点的多跳关联性。进一步提出LACA方法——一种高效且具备严格理论保证的LGC方案，其核心包括：(i) 基于理论基础的快速节点属性预处理技术；(ii) 具有自适应扩散能力和加速收敛特性的向量传播算法；(iii) 高效的三步式BDD近似框架。在8个真实数据集上与17种对比方法的实验表明，LACA在真实局部簇的评估指标上全面优于所有基线方法，同时速度提升达数量级。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重构动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成了任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会新陈代谢系统。SCN绝非静态存在，而是通过企业的进出与供应关系的重组持续演变。本研究利用独特数据集追踪了一个国家SCN中企业及其供应商-客户关系的时间演化。基于匈牙利2014至2022年每月报告的增值税数据，我们重建了包含711,248家企业和38,644,400条连接的整体经济网络，实现了企业级分辨率下完整经济体系重组事件的全面覆盖。研究发现：每年约25%的企业退出SCN，同时28%的新企业加入；平均55%的现存供应链接会在次年消失；供应链接的半衰期为13个月。新链接以超偏好依附概率$p(i)\propto k_i^{1.08}$（$k_i$表示企业i的供应连接数）附着于企业。我们校准了一个能复现匈牙利主导SCN典型特征的简易统计网络生成模型，该模型不仅再现了入度/出度分布、同配性和聚类结构等局部网络特征，还捕捉到真实的系统性风险轮廓。最后探讨了经济重连动态对量化系统韧性和评估冲击传导的关键作用。

摘要

原文标题：Ion beam treatment of thick polystyrene films
中文标题：厚聚苯乙烯薄膜的离子束处理
发布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分类：physics.chem-ph
原文链接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋涂厚度为78纳米至1.3微米的不同厚度聚苯乙烯薄膜，并用能量为20 keV的氮离子进行处理。椭圆偏振测量和傅里叶变换红外光谱显示，表面层的改性对应于离子在聚合物中的穿透深度（约70纳米）。然而，对深层进行清洗和后续测量表明，在薄改性层中形成的自由基迁移到体层中，并引起深层聚苯乙烯化学结构的多种变化。因此，尽管离子在聚苯乙烯薄膜中的穿透深度较小，但整个薄膜的改性深度远大于离子的投影射程。因此，离子束处理聚合物仅在条件上是一种表面改性方法。必须考虑自由基反应及其向聚合物深层迁移的可能性。

摘要

原文标题：The Scalar Size of the Pion from Lattice QCD
中文标题：格点QCD中π介子的标量大小
发布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分类：hep-lat, hep-ph
原文链接：http://arxiv.org/abs/2503.20687v1

中文摘要：我们提出了一种系统误差完全受控的格点QCD计算，用于确定π介子标量形状因子及相关半径。计算结果基于17组Nf=2+1 威尔逊Clover 改进海夸克的规范系综，这些系综覆盖了0.049-0.086fm四种晶格间距、130-350MeV的π介子质量范围以及多种物理体积。通过对著名的夸克断开贡献的精确测定，我们首次在接近物理夸克质量的大尺寸精细系综上实现了形状因子前所未有的动量分辨率。采用1.0-3.25fm宽范围的源汇分离距离，可靠地提取了零动量转移和非零动量转移下的基态矩阵元。这使得我们首次能通过所得形状因子 Q²依赖性的z展开参数化（而非小动量转移下的简单线性近似）来获取标量半径。使用三味NLO 手征微扰理论对半径进行物理外推，以三个低能常数（包括首次格点测定的L₄ʳ）参数化夸克质量依赖性。通过基于赤池信息准则的模型平均，我们量化了基态提取、形状因子参数化以及物理外推等环节对最终结果的系统不确定性。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数最大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：我们研究一维高斯位置混合模型的非参数极大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定包含$n$个数据点的数据集，该估计量总是返回最多包含$n$个分量的混合模型，而近期(Wu-Polyanskiy, 2020)对亚高斯数据给出了尖锐的$O(\log n)$界。本文重点研究$\widehat{\pi}$的计算特性：我们提出一种算法，当$\varepsilon>0$足够小时，可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算出Wasserstein距离意义下的$\varepsilon$-近似解$\widehat\pi$。其中$K$与数据相关但与$\varepsilon$无关，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子数量。我们还可在有限时间内确定性计算出$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$中的点独立采样自具有（相对于勒贝格测度的）密度函数的概率分布时，这些保证几乎必然成立。我们还证明：当限定为$k$原子时，$\widehat\pi$的条件分布在相关$2k-1$维参数空间上存在密度函数（对所有$k\leq \sqrt{n}/3$成立），且EM算法几乎必然具有局部线性收敛性。关键工具之一是针对非退化曲线的经典傅里叶分析估计。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势能（MLIPs）作为一种能够实现大规模、长时间原子模拟的方法备受关注，同时保持与基于密度泛函理论（DFT）和从头算波函数理论的电子结构计算相当的精度。然而，基于MLIP的分子动力学（MD）模拟面临的挑战是其稳定性低于使用传统经典势能的模拟。分析高度异质体系或非晶材料通常需要大规模和长时间的模拟，因此需要开发能够实现稳定MD模拟的鲁棒MLIPs。在本研究中，我们利用神经网络势能（NNP）生成器，构建了一个NNP模型，能够在广泛水合水平下对全氟离聚物膜（Nafion）进行大规模、长时间的MD模拟。通过主动学习循环迭代扩展数据集，我们成功建立了鲁棒的深度势能（DP）模型。具体而言，通过结合非平衡DPMD模拟采样的非平衡结构，以及在包含最小原子间距离的3D结构特征空间中进行结构筛选，可以显著增强DP模型的鲁棒性，从而实现对约10,000至20,000个原子的大型Nafion系统进行长达31 ns的稳定MD模拟。采用所开发DP模型的MD模拟得到的氢原子自扩散系数，在广泛水合水平范围内与实验值更为接近，优于先前对小体系进行的从头算MD模拟结果。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：一个开放、快速、可靠且高效的每日任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过将地址复制到多个位置来实现降低延迟和增强韧性等目标。由于任播在现代互联网中的关键作用，先前研究已开发了执行任播普查的工具。首个工具iGreedy利用地理分散位置的延迟测量来绘制任播部署图；第二个工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查，但存在准确性和精确性问题。相反，iGreedy准确性极高但速度较慢，且探测成本更高。本文针对这两个系统的缺陷，提出了升级版MAnycast Reloaded（MAnycastR）。以MAnycast2为基础，我们彻底重构了其测量管道，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR，对比实际任播生产部署，并通过RIPE Atlas进行大规模延迟测量，同时将检测到的60%以上任播前缀与运营商真实数据进行交叉验证。结果表明MAnycastR实现了高准确性与精确度。我们将持续提供每日MAnycastR普查数据，并以宽松开源协议发布工具源代码。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：基于属性图的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：给定图$G$和种子节点$v_s$，局部图聚类（LGC）的目标是在与$C_s$大小近似线性相关的时间内，识别出围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图的应用场景。然而，现有解决方案大多仅依赖图中节点的拓扑连接性，容易受到现实图谱中普遍存在的缺失或噪声链接的影响。为解决该问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC建模为双向扩散分布（BDD）的估计问题，该模型专门用于捕捉含属性节点的多跳关联性。进一步提出LACA方法——一种高效且具备严格理论保证的LGC方案，其核心包含：(i) 基于理论基础的快速节点属性预处理技术，(ii) 具有自适应扩散能力和加速收敛特性的向量传播算法，(iii) 高效的三步式BDD近似框架。在8个真实数据集上与17种基线方法的对比实验表明，LACA在真实局部簇的评估指标上全面优于所有对比方法，同时速度提升达数量级。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重连动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成了任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会新陈代谢系统。SCN绝非静态存在，而是通过企业的进出和供应关系的重组不断演变。本研究利用独特数据集追踪了一个国家SCN中企业及其供应商-采购商关系的时序演化。基于匈牙利2014至2022年按月申报的增值税数据，我们重建了包含711,248家企业和38,644,400条连接的整体经济网络，实现了企业级分辨率下完整经济体系的重构事件全覆盖。研究发现：每年约25%的企业退出SCN，同时28%的新企业进入；平均55%的现存供应链接会在次年消失；供应链接的半衰期为13个月。新链接以超偏好依附概率$p(i)\propto k_i^{1.08}$（$k_i$表示企业i的供应连接数）附着于企业。我们校准的简易统计网络生成模型成功复现了匈牙利主导SCN的典型特征，不仅能重现入/出度分布、同配性和聚类结构等局部网络特征，还可捕捉真实的系统性风险轮廓。该模型揭示了经济重连动态对量化系统韧性和评估冲击传导的关键作用。

摘要

原文标题：Ion beam treatment of thick polystyrene films
中文标题：厚聚苯乙烯薄膜的离子束处理
发布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分类：physics.chem-ph
原文链接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋涂厚度为78 nm至1.3 μm的聚苯乙烯薄膜经20 keV氮离子束处理后，椭偏仪测量和傅里叶变换红外光谱显示表面改性层深度与离子在聚合物中的穿透深度（约70 nm）相符。然而，深层洗涤及后续测试表明，薄改性层中形成的自由基会迁移至本体层，导致深层聚苯乙烯发生一系列化学结构变化。因此，尽管离子在聚苯乙烯薄膜中的穿透深度较浅，但整个薄膜的改性深度远超过离子投影射程。这表明离子束处理仅能条件性地视为表面改性方法，必须考虑自由基反应及其向聚合物深层迁移的可能性。

摘要

原文标题：The Scalar Size of the Pion from Lattice QCD
中文标题：格点QCD中π介子的标量大小
发布日期：2025-03-26 16:20:11+00:00
作者：Konstantin Ottnad, Georg von Hippel
分类：hep-lat, hep-ph
原文链接：http://arxiv.org/abs/2503.20687v1

中文摘要：我们提出了一种系统误差完全受控的格点QCD计算，用于确定π介子标量形状因子及相关半径。计算结果基于17个规范系综的大规模数据集，这些系综采用$N_f=2+1$威尔逊Clover改进的海夸克配置。这些系综覆盖了从$a=0.049\mathrm{fm}$到$a=0.086\mathrm{fm}$四种格点间距，π介子质量范围为$130-350\mathrm{MeV}$以及多种物理体积。通过对著名的夸克断开贡献的精确测定，我们首次在物理夸克质量附近的大尺度精细系综上实现了形状因子前所未有的动量分辨率。采用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$范围内多种源-汇间距，可靠地提取了零动量转移和非零动量转移下的基态矩阵元。这使得我们能够首次通过所得形状因子$Q^2$依赖性的$z$展开参数化（而非小动量转移下的简单线性近似）来获取标量半径。半径的物理外推采用三味NLO手征微扰理论，通过三个低能常数（包括$L_4^r$的首次格点测定）来参数化夸克质量依赖性。基于赤池信息准则的模型平均方法，我们对基态提取、形状因子参数化以及物理外推等环节产生的系统误差进行了量化处理。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数极大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：我们研究一维高斯位置混合模型的非参数极大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定n个数据点时该估计量总是返回最多含n个分量的混合模型，而近期(Wu-Polyanskiy, 2020)对亚高斯数据给出了严格的$O(\log n)$界。本文研究$\widehat{\pi}$的计算特性：我们提出一种算法，当$\varepsilon>0$足够小时，可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算Wasserstein距离下的$\varepsilon$近似解，其中$K$依赖数据但与$\varepsilon$无关，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$是$\widehat\pi$的原子数。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$来自具有密度（相对于Lebesgue测度）的概率分布时，这些保证几乎必然成立。我们还证明：当$k\leq \sqrt{n}/3$时，限定为k原子的$\widehat\pi$条件分布在相关$2k-1$维参数空间上存在密度，且EM算法几乎必然具有局部线性收敛性。关键工具之一是非退化曲线的经典傅里叶分析估计。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子势的大规模长时质子交换膜质子传输原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势（MLIPs）作为一种能够实现大规模、长时间原子模拟的方法备受关注，同时保持与基于密度泛函理论（DFT）和从头算波函数理论的电子结构计算相当的精度。然而，基于MLIP的分子动力学（MD）模拟面临的挑战是其稳定性低于使用传统经典势的模拟。分析高度异质体系或非晶材料通常需要大规模和长时间的模拟，因此需要开发能够实现稳定MD模拟的鲁棒MLIP。在本研究中，我们利用神经网络势（NNP）生成器，构建了一个NNP模型，能够在广泛水合水平下对全氟离聚物膜（Nafion）进行大规模、长时间的MD模拟。通过主动学习循环迭代扩展数据集，我们成功建立了鲁棒的深度势（DP）模型。具体而言，通过将非平衡DPMD模拟采样的非平衡结构与结合最小原子间距的三维结构特征空间中的结构筛选相结合，可以显著增强DP模型的鲁棒性，从而实现对约10,000至20,000个原子的大型Nafion系统进行长达31 ns的稳定MD模拟。采用所开发DP模型的MD模拟得到的氢原子自扩散系数，在广泛水合水平范围内与实验值更为接近，优于先前对小体系进行的从头算MD模拟结果。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：开放、快速、可靠且高效的每日任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过将地址复制到多个位置来实现（例如）降低延迟和增强韧性。由于任播在现代互联网中的关键作用，先前研究已开发了执行任播普查的工具。首个工具iGreedy利用地理分散位置的延迟测量来映射任播部署；第二个工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——能在3小时内完成全网普查，但存在准确性和精确性问题。相反，iGreedy精度极高但速度较慢，且探测成本更高。本文针对这两个系统的缺陷，提出了MAnycast Reloaded（MAnycastR）。我们以MAnycast2为基础，彻底重构其测量流程，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持，以及类似iGreedy的延迟测量功能。通过在含32个全球分布式节点的任播测试床上验证，与外部任播生产部署对比，结合RIPE Atlas的广泛延迟测量，并对检测到的任播前缀中超过60%进行运营商真实数据交叉核验，证明MAnycastR具备高准确性与精确性。我们将持续提供每日MAnycastR普查数据，并以宽松开源协议发布工具源代码。

摘要

原文标题：Flow of a two-dimensional liquid foam: Impact of surfactant type and boundary conditions
中文标题：二维液体泡沫的流动：表面活性剂类型和边界条件的影响
发布日期：2025-03-26 16:44:40+00:00
作者：Farshad Nazari, Andrei Potanin, Hadi Mohammadigoushki
分类：cond-mat.soft, physics.flu-dyn
原文链接：http://arxiv.org/abs/2503.20710v1

中文摘要：本研究通过实验探究了二维单分散水性泡沫在平行板间剪切时的流变与流动行为，采用自制配备光滑/粗糙壁面的流变光学装置。使用两种市售洗涤剂（Foam 1与Foam 2）制备泡沫，保持气泡尺寸与液相分数相近。线性粘弹性结果表明：无论边界条件如何，Foam 1始终表现出比Foam 2更高的弹性模量与损耗模量，且粗糙壁面会进一步强化两种泡沫的模量。此外，Foam 1的粘弹性弛豫频率更低，表明其界面迁移性较弱。在非线性区域观察到显著差异：光滑边界条件下，Foam 2呈现屈服应力行为而Foam 1未出现，尽管后者具有更高粘性应力。Foam 1的粘性应力与毛细数呈标度关系，而Foam 2的标度行为依边界条件（光滑/粗糙壁面）呈现差异。这些流变行为差异源于表面活性剂化学性质不同导致的界面迁移性差异，Foam 1的界面迁移性相对Foam 2更弱。

摘要

原文标题：Search for events with one displaced vertex from long-lived neutral particles decaying into hadronic jets in the ATLAS muon spectrometer in $pp$ collisions at $\sqrt{s}=13$ TeV
中文标题：在$\sqrt{s}=13$ TeV的$pp$对撞中ATLASμ子谱仪内长寿命中性粒子衰变为强子喷注产生单位移顶点的事例搜寻
发布日期：2025-03-26 11:21:36+00:00
作者：ATLAS Collaboration
分类：hep-ex
原文链接：http://arxiv.org/abs/2503.20445v1

中文摘要：摘要：本文报道了利用大型强子对撞机 ATLAS探测器在2015-2018年收集的$\sqrt{s}=13$ TeV质子-质子对撞数据（积分亮度140 fb$^{-1}$），对长寿命中性粒子衰变为强子喷注产生单位移顶点事件的搜寻。该研究采用特殊重建技术，针对μ子谱仪中距主相互作用顶点3-14米处衰变的长寿命粒子顶点进行重建。观测事件数与预期本底相符，并对多个基准信号模型设定了限制。研究考虑了标量门户模型和希格斯玻色子门户重子生成模型，并专门设计了分析通道来研究Z玻色子伴随的长寿命粒子产生（包括类轴子粒子和暗光子模型）。对于希格斯玻色子模型，在95%置信水平下排除了长寿命粒子固有衰变长度在5厘米至40米范围内分支比高于1%的情况。针对所研究的避光类轴子粒子模型，本次搜寻对固有衰变长度大于$\mathcal{O}(10)$厘米的情况给出了迄今最强的限制。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：基于属性图的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：给定图$G$和种子节点$v_s$，局部图聚类（LGC）的目标是在与$C_s$大小大致成线性关系的时间内，识别出围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图的应用场景。然而，现有解决方案大多仅依赖图中节点的拓扑连接性，容易受到现实图数据中普遍存在的缺失或噪声链接的影响。为解决该问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC建模为双向扩散分布（BDD）的估计问题，该模型专门用于捕捉含属性节点的多跳关联性。进一步提出LACA方法——一种高效且具备强局部性的LGC解决方案，在多个真实数据集上表现出卓越性能。其核心组件包括：（i）基于理论基础的快速节点属性预处理技术；（ii）具有严格理论保证和加速收敛特性的自适应向量扩散算法；（iii）BDD近似计算的有效三步方案。在8个真实数据集上与17种对比方法的实验表明，LACA在真实局部簇的衡量标准下结果质量最优，同时速度可提升数个数量级。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重构动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成了任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会新陈代谢系统。SCN绝非静态存在，而是通过企业的进出与供应关系的重组持续演变。本研究利用独特数据集追踪了一个国家SCN中企业及其供应商-客户关系的时间演化。基于匈牙利2014至2022年每月报告的增值税数据，我们重建了包含711,248家企业和38,644,400条连接的完整经济网络，实现了企业级分辨率下整个经济体重组事件的完整记录。研究发现：每年约25%的企业退出SCN，同时28%的新企业加入；平均55%的现存供应链接会在次年消失；供应链接的半衰期为13个月。新链接以超偏好依附概率$p(i)\propto k_i^{1.08}$（$k_i$表示企业i的供应连接数）与企业建立关联。我们校准了一个能复现匈牙利主导SCN典型特征的简易统计网络生成模型，该模型不仅重现了入/出度分布、同配性和聚类结构等局部网络特征，还捕捉到真实的系统性风险轮廓。最后探讨了经济重连动态对量化系统韧性和估计冲击传导的关键作用。

摘要

原文标题：Ion beam treatment of thick polystyrene films
中文标题：厚聚苯乙烯薄膜的离子束处理
发布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分类：physics.chem-ph
原文链接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋涂厚度为78纳米至1.3微米的不同厚度聚苯乙烯薄膜，并用能量为20 keV的氮离子进行处理。椭圆偏振测量和傅里叶变换红外光谱显示，表面层的改性对应于离子在聚合物中的穿透深度（约70纳米）。然而，对深层进行清洗和后续测量表明，在薄改性层中形成的自由基迁移到体层中，并引起深层聚苯乙烯化学结构的诸多变化。因此，尽管离子在聚苯乙烯薄膜中的穿透深度较小，但整个薄膜的改性深度远大于离子的投影射程。因此，离子束处理聚合物仅在特定条件下是一种表面改性方法。必须考虑自由基反应及其向聚合物深层迁移的可能性。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：开放、快速、可靠且高效的每日任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过将地址复制到多个位置来实现降低延迟和增强韧性等目标。由于任播在现代互联网中的关键作用，先前研究已开发了执行任播普查的工具。首个工具iGreedy利用地理分散位置的延迟测量来绘制任播部署图；第二个工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查，但存在准确性和精确性问题。反之，iGreedy精度极高但速度较慢，且探测成本更高。本文针对这两个系统的缺陷，提出了MAnycast Reloaded（MAnycastR）。我们以MAnycast2为基础，彻底重构其测量流水线，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持以及类似iGreedy的延迟测量功能。通过在含32个全球分布式节点的任播测试床上验证，与外部任播生产部署对比，结合RIPE Atlas的广泛延迟测量，并对检测到的60%以上任播前缀进行运营商数据交叉核验，证明MAnycastR具备高准确性与精确性。我们将持续提供每日MAnycastR普查数据，并以宽松开源协议发布工具源代码。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数极大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：我们研究一维高斯位置混合模型的非参数最大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定n个数据点时该估计量总是返回最多含n个分量的混合模型，而近期(Wu-Polyanskiy, 2020)对亚高斯数据给出了严格的$O(\log n)$界。本文研究$\widehat{\pi}$的计算特性：我们提出一种算法，当$\varepsilon>0$足够小时，可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算出Wasserstein距离意义上的$\varepsilon$近似解，其中$K$与数据相关但与$\varepsilon$无关，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子数量。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有密度函数（相对于勒贝格测度）的概率分布独立采样生成时，这些保证几乎必然成立。我们还证明：当$k\leq \sqrt{n}/3$时，限定为k原子结构的$\widehat\pi$条件分布在相关$2k-1$维参数空间上存在密度函数，且EM算法几乎必然具有局部线性收敛性。其中关键工具是针对非退化曲线的经典傅里叶分析估计。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子势的大规模长时质子交换膜质子传输原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势（MLIPs）作为一种能够实现大规模、长时间原子模拟并保持与基于密度泛函理论（DFT）和从头算波函数理论的电子结构计算相当精度的方法，引起了广泛关注。然而，基于MLIP的分子动力学（MD）模拟面临的挑战是其稳定性低于传统经典势函数。分析高度异质体系或非晶材料通常需要大规模长时间模拟，这要求开发能够实现稳定MD模拟的鲁棒性MLIP。本研究利用我们的神经网络势（NNP）生成器，构建了一个NNP模型，可在广泛水合水平范围内对全氟离聚物膜（Nafion）进行大规模长时间MD模拟。通过主动学习循环迭代扩展数据集，我们成功建立了鲁棒的深度势（DP）模型。具体而言，通过将非平衡DPMD模拟采样的非平衡结构与结合最小原子间距的三维结构特征空间筛选相结合，可显著提升DP模型的鲁棒性，从而实现对约10,000至20,000原子的大型Nafion体系进行长达31 ns的稳定MD模拟。采用所开发DP模型的MD模拟获得的氢原子自扩散系数，在广泛水合水平范围内比先前小体系从头算MD模拟结果更接近实验值。

摘要

原文标题：Flow of a two-dimensional liquid foam: Impact of surfactant type and boundary conditions
中文标题：二维液体泡沫的流动：表面活性剂类型与边界条件的影响
发布日期：2025-03-26 16:44:40+00:00
作者：Farshad Nazari, Andrei Potanin, Hadi Mohammadigoushki
分类：cond-mat.soft, physics.flu-dyn
原文链接：http://arxiv.org/abs/2503.20710v1

中文摘要：本研究通过实验探究了二维单分散水性泡沫在平行板间剪切时的流变与流动行为，采用自制光流变仪（配备光滑/粗糙壁面）完成测试。使用两种市售洗涤剂（Foam 1和Foam 2）制备泡沫，并保持气泡尺寸和液相分数一致。线性粘弹性结果表明：无论边界条件如何，Foam 1始终表现出比Foam 2更高的弹性模量和损耗模量，且粗糙壁面会进一步强化两种泡沫的模量。此外，Foam 1的粘弹性弛豫频率更低，表明其界面流动性较弱。非线性区域则呈现显著差异：在光滑边界条件下，Foam 2表现出屈服应力行为而Foam 1未出现，尽管后者具有更高的粘性应力。Foam 1的粘性应力与毛细数呈标度关系，而Foam 2的标度行为则因光滑/粗糙壁面呈现不同模式。这些流变学差异源于表面活性剂化学性质导致的界面流动性差异，其中Foam 1的界面流动性低于Foam 2。

摘要

原文标题：Search for events with one displaced vertex from long-lived neutral particles decaying into hadronic jets in the ATLAS muon spectrometer in $pp$ collisions at $\sqrt{s}=13$ TeV
中文标题：在$\sqrt{s}=13$ TeV的$pp$对撞中ATLASμ子谱仪内长寿命中性粒子衰变为强子喷注产生单位移顶点的事例搜寻
发布日期：2025-03-26 11:21:36+00:00
作者：ATLAS Collaboration
分类：hep-ex
原文链接：http://arxiv.org/abs/2503.20445v1

中文摘要：摘要：本文报道了利用ATLAS探测器在大型强子对撞机上收集的数据（2015-2018年记录的$\sqrt{s}=13$ TeV质子-质子对撞数据，积分亮度140 fb$^{-1}$）对长寿命中性粒子衰变为强子喷注产生单位移顶点事件的搜寻。该研究采用顶点重建技术，针对μ子谱仪中距初级相互作用顶点3-14米处衰变的长寿命粒子。观测事件数与预期本底相符，并确定了若干基准信号模型的限制。研究考虑了标量门户模型和希格斯玻色子门户重子生成模型，同时设立专门分析通道针对Z玻色子伴随的长寿命粒子产生（包括类轴子粒子和暗光子模型）。对于希格斯玻色子模型，在95%置信水平下排除了长寿命粒子固有衰变长度5厘米至40米范围内分支比高于1%的情况；对于所研究的避光类轴子粒子模型，本次搜寻对固有衰变长度大于$\mathcal{O}(10)$厘米的情况给出了迄今最强的限制。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：基于属性图的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：给定图$G$和种子节点$v_s$，局部图聚类（LGC）的目标是在与$C_s$大小大致成线性关系的时间内，识别出围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图的应用场景。然而现有方案大多仅依赖图中节点的拓扑连接性，容易受到现实图谱中普遍存在的缺失链接或噪声链接的影响。为解决该问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC建模为双向扩散分布（BDD）的估计问题，该模型专门用于捕捉带属性节点的多跳关联性。进一步提出LACA方法——一种高效且具备严格理论保证的LGC方案，其核心组件包括：(i) 快速且理论完备的节点属性预处理技术；(ii) 具有理论收敛保证的自适应向量扩散算法；(iii) 高效的三步式BDD近似方案。在8个真实数据集上与17种对比方法的实验表明，LACA在真实局部簇的衡量标准下全面优于所有对比方法，同时速度提升达数量级。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：Ion beam treatment of thick polystyrene films
中文标题：厚聚苯乙烯薄膜的离子束处理
发布日期：2025-03-26 09:39:21+00:00
作者：Alexey Kondyurin
分类：physics.chem-ph
原文链接：http://arxiv.org/abs/2503.20359v1

中文摘要：摘要：在硅片上旋涂厚度从78纳米至1.3微米不等的聚苯乙烯薄膜，经20 keV氮离子束处理后，椭圆偏振测量和傅里叶变换红外光谱显示表面改性层深度与离子在聚合物中的穿透深度（约70纳米）相符。然而，深层洗涤及后续测试表明，薄改性层中形成的自由基会迁移至本体层，导致深层聚苯乙烯的化学结构发生系列变化。因此，尽管离子在聚苯乙烯膜中的穿透深度有限，整个薄膜的改性深度却远超过离子投影射程。这表明离子束处理仅能有条件地视为表面改性方法，必须考虑自由基反应及其向聚合物深层迁移的可能性。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：一个开放、快速、可靠且高效的每日任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过将地址复制到多个位置来实现（例如）降低延迟和增强韧性。由于任播在现代互联网中的关键作用，先前研究已开发了执行任播普查的工具。首个工具iGreedy利用地理分散位置的延迟测量来绘制任播部署图；第二个工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查，但存在准确性和精确性问题。相反，iGreedy精度极高但速度较慢，且探测成本更高。本文针对这两个系统的缺陷提出了MAnycast Reloaded（MAnycastR）。以MAnycast2为基础，我们彻底重构了其测量流水线，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR，对比实际任播生产部署，并通过RIPE Atlas进行广泛延迟测量，同时将检测到的60%以上任播前缀与运营商真实数据交叉核验。结果表明MAnycastR实现了高准确性与精确度。我们将持续提供每日MAnycastR普查数据，并以宽松开源协议发布工具源代码。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重构动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会代谢系统。供应链网络绝非静态，而是通过企业的进出和供应关系的重组不断变化。本研究利用独特数据集探究了一个国家供应链网络中企业及其供应商-客户关系的时间演化。基于匈牙利2014至2022年按月申报的增值税数据，我们重建了包含711,248家企业和38,644,400条连接关系的完整经济网络，以企业级分辨率覆盖了整个经济体的几乎每次重构事件。研究发现：每年约25%的企业退出供应链网络，同时28%的新企业加入；平均55%的现存供应链接会在次年消失；供应链接的半衰期为13个月。新链接以超偏好依附概率$p(i)\propto k_i^{1.08}$连接企业（$k_i$表示企业$i$的供应连接数）。我们校准了一个能复现匈牙利主导供应链网络典型特征的简单统计网络生成模型，该模型不仅复现了入/出度分布、同配性和聚类结构等局部网络特征，还捕捉了真实的系统性风险特征。最后讨论了当前模型如何通过经济重连动态来量化系统韧性和估计冲击传导。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数最大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：摘要：我们研究一维高斯位置混合的非参数极大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定n个数据点时该估计量始终返回最多含n个分量的混合模型，而近期(Wu-Polyanskiy, 2020)对次高斯数据给出了严格的$O(\log n)$界。本文研究$\widehat{\pi}$的计算特性：提出一种算法，当$\varepsilon>0$足够小时，可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算Wasserstein距离下的$\varepsilon$近似解，其中$K$与数据相关但与$\varepsilon$无关，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$为$\widehat\pi$的原子数。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有密度（相对于Lebesgue测度）的概率分布独立生成时，这些保证几乎必然成立。我们还证明：当$k\leq \sqrt{n}/3$时，限定为k原子分布的$\widehat\pi$在其$2k-1$维参数空间上具有密度，且EM算法几乎必然局部线性收敛。关键工具之一是非退化曲线的经典傅里叶分析估计。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子势的大规模长时质子交换膜质子传输原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势能（MLIPs）作为一种能够实现大规模、长时间原子尺度模拟的方法备受关注，同时保持与基于密度泛函理论（DFT）和从头算波函数理论的电子结构计算相当的精度。然而，基于MLIP的分子动力学（MD）模拟面临的挑战是其稳定性低于使用传统经典势能的模拟。分析高度异质体系或非晶材料通常需要大规模和长时间的模拟，因此需要开发能够进行稳定MD模拟的鲁棒MLIPs。在本研究中，我们利用神经网络势能（NNP）生成器，构建了一个NNP模型，能够在广泛水合水平下对全氟磺酸离聚物膜（Nafion）进行大规模、长时间的MD模拟。通过主动学习循环迭代扩展数据集，我们成功构建了鲁棒的深度势能（DP）模型。具体而言，通过结合非平衡DPMD模拟对非平衡结构的采样与在包含最小原子间距离的3D结构特征空间中的结构筛选，可以显著增强DP模型的鲁棒性，这使得能够对大约10,000至20,000个原子的大型Nafion体系进行长达31 ns的稳定MD模拟。采用所开发DP模型的MD模拟得到的氢原子自扩散系数，在广泛的水合水平范围内，与先前较小体系的从头算MD模拟相比，更接近实验值。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：基于属性图的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：给定图$G$和种子节点$v_s$，局部图聚类(LGC)的目标是在与$C_s$大小大致成线性关系的时间内，识别出围绕$v_s$的子图$C_s \in G$(即局部簇)。这种方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图的应用场景。然而，现有解决方案大多仅依赖图中节点的拓扑连接性，容易受到现实图数据中普遍存在的缺失链接或噪声链接的影响。为解决这一问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC建模为双向扩散分布(BDD)的估计问题，该模型专门用于捕捉带属性节点的多跳关联性。进一步提出LACA方法——一种高效且具备强局部性的LGC解决方案，在多个真实数据集上表现出卓越性能。LACA的核心组件包括：(i)基于理论基础的快速节点属性预处理技术；(ii)具有严格理论保证和加速收敛特性的自适应向量扩散算法；(iii)有效的BDD近似三步骤方案。通过在8个真实数据集上与17种对比方法的实验表明，LACA在真实局部簇的评估指标上全面优于所有对比方法，同时实现数量级的速度提升。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：开放、快速、可靠且高效的每日任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过将地址复制到多个位置来实现，例如降低延迟和增强弹性。由于任播在现代互联网中的关键作用，先前研究引入了执行任播普查的工具。首个工具iGreedy利用地理分散位置的延迟测量来映射任播部署；第二个工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查，但存在准确性和精确性问题。相反，iGreedy精度极高但速度较慢，且探测成本更高。本文针对这两个系统的缺陷，提出了MAnycast Reloaded（MAnycastR）。以MAnycast2为基础，我们彻底重构了其测量流水线，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持，以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR，对比外部任播生产部署，通过RIPE Atlas进行广泛延迟测量，并将检测到的60%以上任播前缀与运营商真实数据交叉核验。结果表明MAnycastR实现了高准确性和精确性。我们以宽松开源协议向社区提供每日持续的MAnycastR普查数据，并公开工具源代码。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重构动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成了任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会新陈代谢系统。SCN绝非静态存在，而是通过企业的进出和供应关系的重组持续演变。本研究利用独特数据集追踪了一个国家SCN中企业及其供应商-客户关系的时间演化。基于匈牙利2014至2022年每月报告的增值税数据，我们重建了包含711,248家企业和38,644,400条连接的完整经济网络，以企业级分辨率捕捉了整个经济体的每次重构事件。研究发现：每年约25%的企业退出SCN，同时28%的新企业加入；平均55%的现存供应链接会在次年消失；供应链接的半衰期为13个月。新链接以超偏好方式依附企业，概率满足$p(i)\propto k_i^{1.08}$（$k_i$表示企业i的供应连接数）。我们校准了一个能复现匈牙利主导SCN典型特征的简易统计网络生成模型，该模型不仅再现了入/出度分布、同配性和聚类结构等局部网络特征，还捕捉了真实的系统性风险轮廓。最后探讨了经济重连动态对量化系统韧性和估计冲击传导的关键作用。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数极大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：我们研究一维高斯位置混合的非参数最大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定一个$n$点数据集，该估计量总是返回最多包含$n$个分量的混合分布，而最近(Wu-Polyanskiy, 2020)对亚高斯数据给出了严格的$O(\log n)$界。本文研究$\widehat{\pi}$的计算特性：我们提出一种算法，当$\varepsilon>0$足够小时，可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算出Wasserstein距离意义上的$\varepsilon$近似解$\widehat\pi$。其中$K$与数据相关但与$\varepsilon$无关，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子数量。我们还可在有限时间内确定性计算出$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有密度（相对于Lebesgue测度）的概率分布独立采样时，这些保证几乎必然成立。我们还证明：当$\widehat\pi$被约束为$k$原子分布时，其在相关$2k-1$维参数空间上存在密度（对所有$k\leq \sqrt{n}/3$成立），且EM算法几乎必然具有局部线性收敛性。关键工具之一是对非退化曲线的经典傅里叶分析估计。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子势的聚合物电解质膜质子传输大规模长时间原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势（MLIPs）作为一种能够实现大规模、长时间原子尺度模拟的方法，同时保持与基于密度泛函理论（DFT）和第一性原理波函数理论的电子结构计算相当的精度，引起了广泛关注。然而，基于MLIP的分子动力学（MD）模拟面临的挑战是其稳定性低于使用传统经典势的模拟。分析高度异质体系或非晶材料通常需要大规模和长时间的模拟，因此需要开发能够实现稳定MD模拟的鲁棒MLIPs。在本研究中，我们利用神经网络势（NNP）生成器，构建了一个NNP模型，能够在广泛水合水平范围内对全氟离聚物膜（Nafion）进行大规模、长时间的MD模拟。通过主动学习循环迭代扩展数据集，我们成功建立了鲁棒的深度势（DP）模型。具体而言，通过将非平衡DPMD模拟采样的非平衡结构与结合最小原子间距的三维结构特征空间中的结构筛选相结合，可以显著增强DP模型的鲁棒性，从而实现对约10,000至20,000个原子的大型Nafion体系进行长达31 ns的稳定MD模拟。采用所开发DP模型的MD模拟得到的氢原子自扩散系数，在广泛水合水平范围内与实验值更为吻合，优于先前对小体系进行的第一性原理 MD模拟结果。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：基于属性图的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：给定图$G$和种子节点$v_s$，局部图聚类（LGC）的目标是在与$C_s$大小近似线性相关的时间内，识别出围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图的应用场景。然而，现有解决方案大多仅依赖图中节点的拓扑连接性，容易受到现实图数据中普遍存在的缺失或噪声链接的影响。为解决该问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC建模为双向扩散分布（BDD）的估计问题，该模型专门用于捕捉含属性节点的多跳关联性。进一步提出LACA方法——一种高效且具备严格理论保证的LGC解决方案：其核心包括（i）基于理论基础的快速节点属性预处理技术；（ii）具备加速收敛特性的自适应图向量扩散算法；（iii）BDD近似计算的三步优化方案。在8个真实数据集上与17种对比方法的实验表明，LACA在真实局部簇的评估指标上全面超越现有方法，同时实现数量级的速度提升。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：一个开放、快速、可靠且高效的每日任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过在多位置复制地址来实现降低延迟和增强韧性等目标。由于任播在现代互联网中的关键作用，先前研究已开发了执行任播普查的工具。首个工具iGreedy利用地理分散位置的延迟测量来绘制任播部署图；第二个工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度，可在3小时内完成全网普查，但存在准确性和精确度问题。相反，iGreedy精度极高但速度较慢，且探测成本更高。本文针对这两个系统的缺陷提出了MAnycast Reloaded（MAnycastR）。以MAnycast2为基础，我们彻底重新设计了其测量流程，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR，与外部任播生产部署进行对比，并通过RIPE Atlas进行广泛延迟测量，同时将检测到的60%以上任播前缀与运营商真实数据交叉核验。结果表明MAnycastR实现了高准确性和精确度。我们将持续提供每日MAnycastR普查数据，并以宽松开源协议发布该工具的源代码。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重连动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成了任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会代谢系统。SCN绝非静态存在，而是通过企业的进出与供应关系的重组持续演变。本研究利用独特数据集追踪了一个国家SCN中企业及其供需关系的时序演化。基于匈牙利2014至2022年按月申报的增值税数据，我们重建了包含711,248家企业和38,644,400条连接的整体经济网络，以企业级分辨率覆盖了近乎所有经济重构事件。研究发现：每年约25%的企业退出SCN，同时28%的新企业加入；平均55%的年度供应关系会在次年消失；供应关系的半衰期为13个月。新连接以超偏好依附方式链接企业，概率满足$p(i)\propto k_i^{1.08}$（$k_i$表示企业$i$的连接数）。我们校准的简易统计网络生成模型成功复现了匈牙利主导SCN的特征模式，不仅匹配入/出度分布、同配性和聚类结构等局部特征，还能捕捉真实的系统性风险轮廓。该模型揭示了经济重连动态对量化系统韧性和评估冲击传导的关键作用。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数极大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：我们研究一维高斯位置混合的非参数极大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定n个数据点时该估计量总是返回最多含n个分量的混合分布，而近期(Wu-Polyanskiy, 2020)对亚高斯数据给出了精确的$O(\log n)$界。本文研究$\widehat{\pi}$的计算特性：提出一种算法，当$\varepsilon>0$足够小时，可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算得到Wasserstein距离意义上的$\varepsilon$近似解，其中$K$依赖数据但独立于$\varepsilon$，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子数。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$来自具有Lebesgue测度密度的概率分布时，这些保证几乎必然成立。同时证明：当$k\leq \sqrt{n}/3$时，限定为k原子分布的$\widehat\pi$在其$2k-1$维参数空间上存在密度，且EM算法几乎必然具有局部线性收敛性。关键工具之一是对非退化曲线的经典傅里叶分析估计。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势（MLIPs）作为一种能够实现大规模、长时间原子尺度模拟的方法备受关注，同时保持与基于密度泛函理论（DFT）和从头算波函数理论的电子结构计算相当的精度。然而，基于MLIP的分子动力学（MD）模拟面临的一个挑战是，与传统经典势相比其稳定性较低。分析高度异质体系或非晶材料通常需要大规模和长时间的模拟，因此有必要开发能够实现稳定MD模拟的鲁棒性MLIP。在本研究中，我们利用自研的神经网络势（NNP）生成器，构建了一个NNP模型，能够对全氟离聚物膜（Nafion）在不同水合水平下进行大规模、长时间的MD模拟。通过主动学习循环迭代扩展数据集，我们成功建立了鲁棒的深度势（DP）模型。具体而言，通过将非平衡DPMD模拟采样的非平衡结构与结合最小原子间距的三维结构特征空间中的结构筛选相结合，可以显著增强DP模型的鲁棒性，从而实现对约10,000至20,000个原子的大型Nafion体系进行长达31 ns的稳定MD模拟。采用所开发DP模型的MD模拟获得的氢原子自扩散系数，在广泛的水合水平范围内比先前对小体系进行的从头算MD模拟更接近实验值。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：基于属性图的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：给定属性图$G$和种子节点$v_s$，局部图聚类（LGC）的目标是在与$C_s$规模大致成线性关系的时间内，识别出围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图的应用场景。然而现有方案大多仅依赖图中节点的拓扑连接性，容易受到现实图谱中普遍存在的缺失链接或噪声链接的影响。为解决该问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC建模为双向扩散分布（BDD）的估计问题，该模型专门用于捕捉含属性节点的多跳关联性。进一步提出LACA方法——一种高效且具备强局部性的LGC解决方案，在多个真实数据集上展现出卓越性能。其核心组件包括：(i) 基于理论基础的快速节点属性预处理技术；(ii) 具有严格理论保证和加速收敛特性的自适应向量扩散算法；(iii) 高效的三步式BDD近似方案。通过在8个真实数据集上与17种对比方法的实验表明，LACA在真实局部簇的衡量标准下结果质量最优，同时速度可提升数个数量级。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：一个开放、快速、可靠且高效的每日任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过在多位置复制地址来实现降低延迟和增强韧性等目标。由于任播在现代互联网中的关键作用，先前研究已开发了执行任播普查的工具。首个工具iGreedy利用地理分散位置的延迟测量来绘制任播部署图；第二个工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度，能在3小时内完成全网普查，但存在准确性和精确性问题。反之，iGreedy精度极高但速度较慢，且探测成本更高。本文针对这两个系统的缺陷，提出了MAnycast Reloaded（MAnycastR）。以MAnycast2为基础，我们彻底重新设计了其测量流程，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持以及类似iGreedy的延迟测量功能。我们在含32个全球分布节点的任播测试平台上验证MAnycastR，与外部任播生产部署进行对比，并通过RIPE Atlas进行广泛延迟测量，同时将检测到的60%以上任播前缀与运营商真实数据交叉验证。结果表明MAnycastR实现了高准确性和精确度。我们以宽松开源许可向社区提供每日持续的MAnycastR普查数据，并发布该工具的源代码。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重构动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成了任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会新陈代谢系统。供应链网络绝非静态存在，而是通过企业的进入退出与供应关系的持续重组经历着永久性变化。本文利用独特数据集研究了一个国家供应链网络中企业及其供应商-采购商关系的时间演化。基于匈牙利2014至2022年按月申报的增值税数据，我们重建了包含711,248家企业和38,644,400条连接关系的完整经济网络，实现了企业级分辨率下整个经济体几乎所有重构事件的覆盖。研究发现：每年约25%的企业退出供应链网络，同时28%的新企业进入；平均而言，当年存在的供应链接中有55%会在次年消失；供应链接的半衰期为13个月。新链接以超偏好依附方式连接企业，概率满足$p(i)\propto k_i^{1.08}$（$k_i$表示企业$i$的供应连接数）。我们校准了一个能复现匈牙利主导供应链网络典型特征的简易统计网络生成模型，该模型不仅再现了入/出度分布、同配性和聚类结构等局部网络特征，还捕捉到真实的系统性风险特征。最后探讨了经济网络重连动态对量化系统韧性和估计冲击传导的关键作用。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数最大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：我们研究一维高斯位置混合模型的非参数最大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定n个数据点时该估计量总是返回最多含n个分量的混合模型，而近期(Wu-Polyanskiy, 2020)对亚高斯数据给出了精确的$O(\log n)$界。本文研究$\widehat{\pi}$的计算特性：我们提出的算法能在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算Wasserstein距离意义上的$\varepsilon$近似解，其中$K$与$\varepsilon$无关但依赖数据，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子数量。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$来自具有密度（相对于Lebesgue测度）的概率分布时，这些保证几乎必然成立。我们进一步证明：当$\widehat\pi$被约束为k原子分布时，其在$2k-1$维参数空间上存在密度（对所有$k\leq \sqrt{n}/3$成立），且EM算法几乎必然具有局部线性收敛性。关键工具之一是针对非退化曲线的经典傅里叶分析估计。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子间势的聚合物电解质膜质子传输大规模长时原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势（MLIPs）作为一种能够实现大规模、长时间原子尺度模拟的方法，同时保持与基于密度泛函理论（DFT）和从头算波函数理论的电子结构计算相当的精度，引起了广泛关注。然而，基于MLIP的分子动力学（MD）模拟面临的一个挑战是，与传统经典势相比其稳定性较低。分析高度异质体系或非晶材料通常需要大规模和长时间的模拟，因此需要开发能够实现稳定MD模拟的鲁棒MLIP。在本研究中，我们利用神经网络势（NNP）生成器，构建了一个NNP模型，能够在广泛水合水平下对全氟离聚物膜（Nafion）进行大规模、长时间的MD模拟。通过主动学习循环迭代扩展数据集，我们成功建立了鲁棒的深度势（DP）模型。具体而言，通过将非平衡DPMD模拟采样的非平衡结构与结合最小原子间距的三维结构特征空间中的结构筛选相结合，可以显著增强DP模型的鲁棒性，从而实现对约10,000至20,000个原子的大型Nafion体系进行长达31 ns的稳定MD模拟。采用所开发DP模型的MD模拟获得的氢原子自扩散系数，在广泛水合水平范围内与实验值更为吻合，优于先前对小体系进行的从头算MD模拟结果。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：基于属性图的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：给定图$G$和种子节点$v_s$，局部图聚类（LGC）的目标是在与$C_s$大小近似线性相关的时间内，识别出围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图的应用场景。然而现有方案大多仅依赖图中节点的拓扑连接性，容易受到现实图谱中普遍存在的缺失或噪声链接的影响。为解决该问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC建模为双向扩散分布（BDD）的估计问题，该模型专门用于捕捉含属性节点间的多跳关联。进一步提出LACA方法——一种高效且具备严格理论保证的LGC方案：其核心包括（i）基于理论基础的快速节点属性预处理技术；（ii）具备加速收敛特性的自适应图向量扩散算法；（iii）BDD近似计算的三步优化框架。在8个真实数据集上与17种基线方法的对比实验表明，LACA在真实局部簇的衡量标准下全面优于所有对比方法，同时实现数量级的速度提升。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：一个开放、快速、可靠且高效的每日任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过在多位置复制地址来实现降低延迟和增强韧性等目标。由于任播在现代互联网中的关键作用，先前研究已开发了执行任播普查的工具。首个工具iGreedy利用地理分散位置的延迟测量来绘制任播部署图；第二个工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查，但存在准确性和精确性问题。相反，iGreedy精度极高但速度较慢，且探测成本更高。本文针对这两个系统的缺陷提出了MAnycast Reloaded（MAnycastR）。以MAnycast2为基础，我们彻底重构了其测量流程，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR，与外部任播生产部署对比，并通过RIPE Atlas进行广泛延迟测量，同时对检测到的60%以上任播前缀进行运营商数据交叉验证。结果表明MAnycastR实现了高准确性与精确度。我们将持续提供每日MAnycastR普查数据，并以宽松开源协议发布工具源代码。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重构动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成了任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会新陈代谢系统。供应链网络绝非静态存在，而是通过企业的进出与供应关系的重组持续演变。本研究利用独特数据集追踪了一个国家供应链网络中企业及其供应商-客户关系的时间演化。基于匈牙利2014至2022年按月申报的增值税数据，我们重构了包含711,248家企业和38,644,400条连接的完整经济网络，以企业级分辨率捕捉了整个经济体的几乎每次重构事件。研究发现：每年约25%的企业退出供应链网络，同时28%的新企业加入；平均55%的现存供应关系会在次年消失；供应关系的半衰期为13个月。新连接以超偏好依附概率$p(i)\propto k_i^{1.08}$（$k_i$表示企业i的供应连接数）与企业建立关联。我们校准了一个能复现匈牙利主导供应链网络典型特征的简易统计网络生成模型，该模型不仅再现了入/出度分布、同配性和聚类结构等局部网络特征，还捕捉了真实的系统性风险轮廓。最后探讨了经济网络重连动态对量化系统韧性和估计冲击传导的关键作用。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数极大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：我们研究一维高斯位置混合模型的非参数最大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定包含$n$个数据点的数据集，该估计量始终返回最多包含$n$个分量的混合模型，而近期(Wu-Polyanskiy, 2020)对次高斯数据给出了严格的$O(\log n)$界。本文重点研究$\widehat{\pi}$的计算特性：我们提出一种算法，当$\varepsilon>0$足够小时，可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算出Wasserstein距离意义上的$\varepsilon$近似解$\widehat\pi$。其中$K$与数据相关但与$\varepsilon$无关，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子数量。我们还可在有限时间内确定性计算出$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$中的点独立采样自具有（相对于勒贝格测度的）密度函数的概率分布时，这些保证几乎必然成立。我们还证明：当$\widehat\pi$被约束为$k$原子分布时，对于所有$k\leq \sqrt{n}/3$的情况，其在相关$2k-1$维参数空间上存在密度函数，且EM算法几乎必然具有局部线性收敛性。关键工具之一是对非退化曲线的经典傅里叶分析估计。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势（MLIPs）作为一种能够实现大规模、长时间原子模拟的方法备受关注，同时保持与基于密度泛函理论（DFT）和从头算波函数理论的电子结构计算相当的精度。然而，基于MLIP的分子动力学（MD）模拟面临的一个挑战是，与传统经典势相比其稳定性较低。分析高度异质体系或非晶材料通常需要大规模和长时间的模拟，因此有必要开发能够实现稳定MD模拟的鲁棒MLIPs。在本研究中，我们利用神经网络势（NNP）生成器，构建了一个NNP模型，该模型能够对全氟离聚物膜（Nafion）在不同水合水平下进行大规模、长时间的MD模拟。通过主动学习循环迭代扩展数据集，我们成功建立了一个鲁棒的深度势（DP）模型。具体而言，通过将非平衡 DPMD模拟采样的非平衡结构与结合最小原子间距离的三维结构特征空间中的结构筛选相结合，可以显著增强DP模型的鲁棒性，从而实现对约10,000至20,000个原子的大型Nafion体系进行长达31 ns的稳定MD模拟。采用所开发DP模型的MD模拟获得的氢原子自扩散系数，在广泛水合水平范围内与实验值更为吻合，优于先前对小体系进行的从头算MD模拟结果。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：属性图上的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：给定图$G$和种子节点$v_s$，局部图聚类（LGC）的目标是在与$C_s$大小大致成线性关系的时间内，识别出围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，因此非常适用于涉及大规模图的应用场景。然而，现有解决方案大多仅依赖图中节点的拓扑连接性，容易受到现实图数据中普遍存在的缺失或噪声链接的影响。为解决这一问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC建模为双向扩散分布（BDD）的估计问题，该模型专门用于捕捉带属性节点的多跳关联性。进一步提出LACA方法——一种高效且具备严格理论保证的LGC方案，其核心组件包括：（i）快速且理论完备的节点属性预处理技术；（ii）具有理论收敛保证的自适应向量扩散算法；（iii）高效的三步式BDD近似框架。在8个真实数据集上与17种基线方法的对比实验表明，LACA在真实局部簇的评估指标上全面优于所有对比方法，同时速度提升可达数量级。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：开放、快速、可靠且高效的日常任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过在多位置复制地址来实现降低延迟和增强韧性等目标。由于任播在现代互联网中的关键作用，先前研究已开发了执行任播普查的工具。首个工具iGreedy利用地理分散位置的延迟测量来映射任播部署；第二个工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查，但存在准确性和精确性问题。反之，iGreedy精度极高但速度较慢，且探测成本更高。本文针对这两个系统的缺陷，提出了MAnycast Reloaded（MAnycastR）。以MAnycast2为基础，我们彻底重新设计了其测量流程，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持，以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR，与外部任播生产部署进行对比，通过RIPE Atlas进行广泛延迟测量，并对检测到的60%以上任播前缀进行运营商数据交叉验证。结果表明MAnycastR实现了高准确性与精确性。我们将持续提供每日MAnycastR普查数据，并以宽松开源协议发布工具源代码。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重构动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成了任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会新陈代谢系统。SCN绝非静态存在，而是通过企业的进出与供应关系的重组持续演变。本研究利用独特数据集追踪了一个国家供应链网络中企业及其供应商-客户关系的时间演化。基于匈牙利2014至2022年按月申报的增值税数据，我们重构了包含711,248家企业和38,644,400条连接的完整经济网络，以企业级分辨率捕捉了整个经济体的每次重构事件。研究发现：每年约25%的企业退出SCN，同时28%的新企业加入；平均55%的现存供应链接会在次年消失；供应链接的半衰期为13个月。新链接以超偏好依附概率$p(i)\propto k_i^{1.08}$（$k_i$表示企业i的供应连接数）附着于企业。我们校准了一个能复现匈牙利主导SCN典型特征的简易统计网络生成模型，该模型不仅再现了入/出度分布、同配性和聚类结构等局部网络特征，还捕捉了真实的系统性风险轮廓。最后探讨了经济重连动态对量化系统韧性和估计冲击传导的关键作用。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数最大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：我们研究一维高斯位置混合的非参数极大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定n个数据点时该估计量总是返回最多含n个分量的混合分布，而近期(Wu-Polyanskiy, 2020)对次高斯数据给出了尖锐的$O(\log n)$界。本文研究$\widehat{\pi}$的计算特性：针对足够小的$\varepsilon>0$，我们提出一个算法可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算Wasserstein距离意义上的$\varepsilon$近似解，其中$K$与数据相关但与$\varepsilon$无关，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子数。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有密度函数（相对于Lebesgue测度）的概率分布独立采样时，这些保证几乎必然成立。我们进一步证明：当$k\leq \sqrt{n}/3$时，限定为k原子分布的$\widehat\pi$条件分布在相应$2k-1$维参数空间上存在密度函数，且EM算法几乎必然具有局部线性收敛性。关键工具之一是关于非退化曲线的经典傅里叶分析估计。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势（MLIPs）作为一种能够实现大规模、长时间原子尺度模拟的方法，同时保持与基于密度泛函理论（DFT）和第一性原理波函数理论的电子结构计算相当的精度，引起了广泛关注。然而，基于MLIP的分子动力学（MD）模拟面临的一个挑战是，与使用传统经典势的模拟相比，其稳定性较低。分析高度异质体系或非晶材料通常需要大规模和长时间的模拟，因此需要开发能够实现稳定MD模拟的鲁棒MLIPs。在本研究中，我们利用神经网络势（NNP）生成器，构建了一个NNP模型，能够在广泛水合水平范围内对全氟离聚物膜（Nafion）进行大规模、长时间的MD模拟。通过主动学习循环迭代扩展数据集，我们成功构建了一个鲁棒的深度势（DP）模型。具体而言，通过将非平衡 DPMD模拟采样的非平衡结构与结合最小原子间距离的三维结构特征空间中的结构筛选相结合，可以显著增强DP模型的鲁棒性，从而实现对约10,000至20,000个原子的大型Nafion体系进行长达31 ns的稳定MD模拟。采用所开发DP模型的MD模拟得到的氢原子自扩散系数，与先前较小体系的第一性原理 MD模拟相比，在广泛水合水平范围内更接近实验值。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：基于属性图的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：给定图$G$和种子节点$v_s$，局部图聚类（LGC）的目标是在与$C_s$大小近似线性相关的时间内，识别出围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，因此非常适用于涉及大规模图的应用场景。然而，现有解决方案大多仅依赖图中节点的拓扑连接性，容易受到现实图数据中普遍存在的缺失或噪声链接的影响。为解决该问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC建模为双向扩散分布（BDD）的估计问题，该模型专门用于捕捉带属性节点的多跳亲和度。进一步提出LACA方法——一种高效且具备严格理论保证的LGC解决方案：其核心包括（i）基于理论基础的快速节点属性预处理技术；（ii）具备理论保证且加速收敛的自适应向量扩散算法；（iii）BDD近似计算的三步高效方案。在8个真实数据集上与17种对比方法的实验表明，LACA在真实局部簇的衡量标准下均优于所有基线方法，同时速度提升达数量级。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：一个开放、快速、可靠且高效的每日任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过在多位置复制地址来实现降低延迟和增强韧性等目标。由于任播在现代互联网中的关键作用，先前研究已开发了执行任播普查的工具。首个工具iGreedy利用地理分散位置的延迟测量来绘制任播部署图；第二个工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——仅需3小时即可完成全网普查，但存在准确性和精确度问题。反之，iGreedy精度极高但速度较慢，且探测成本显著更高。本文针对这两个系统的缺陷提出了MAnycast Reloaded（MAnycastR）。基于MAnycast2框架，我们彻底重构了其测量流程，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR，对比实际任播生产部署，并通过RIPE Atlas进行大规模延迟测量，同时对检测到的60%以上任播前缀进行运营商数据交叉核验。结果表明MAnycastR实现了高准确性与精确度。我们将持续提供每日MAnycastR普查数据，并以宽松开源协议发布工具源代码。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：属性图上的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：给定图$G$和种子节点$v_s$，局部图聚类（LGC）的目标是在与$C_s$大小大致成线性关系的时间内，识别出围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图的应用场景。然而，现有解决方案大多仅依赖图中节点的拓扑连接性，容易受到现实图数据中普遍存在的缺失或噪声链接的影响。为解决这一问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC建模为双向扩散分布（BDD）的估计问题，该模型专门用于捕捉带属性节点的多跳关联性。进一步提出LACA方法——一种高效且具备严格理论保证的LGC解决方案：其核心包括（i）基于理论基础的快速节点属性预处理技术；（ii）具有理论收敛保证的自适应图向量扩散算法；（iii）高效的三步式BDD近似方案。在8个真实数据集上与17种基线方法的对比实验表明，LACA在真实局部簇标准下的结果质量显著优于所有对比方法，同时速度可提升数个数量级。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重连动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会代谢系统。供应链网络绝非静态存在，而是通过企业的进出与供应关系的重组持续演变。本研究利用独特数据集追踪了一个国家供应链网络中企业及其供应商-客户关系的时间演化。基于匈牙利2014至2022年按月申报的增值税数据，我们重构了包含711,248家企业和38,644,400条连接的完整经济网络，实现了企业级分辨率下整个经济体系重组事件的完整捕捉。研究发现：每年约25%的企业退出供应链网络，同时28%的新企业进入；平均55%的现存供应链接会在次年消失；供应链接的半衰期为13个月。新链接以超偏好依附概率$p(i)\propto k_i^{1.08}$（$k_i$表示企业i的供应连接数）与企业建立连接。我们校准的简易统计网络生成模型成功复现了匈牙利主导供应链网络的典型特征，不仅能重现入/出度分布、同配性和聚类结构等局部网络特征，还能捕捉真实的系统性风险轮廓。最后探讨了该模型如何通过经济网络的重连动态来量化系统韧性并评估冲击传导。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数最大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：我们研究一维高斯位置混合模型的非参数最大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定n个数据点时，该估计量总是返回最多含n个混合模型的分量；而近期(Wu-Polyanskiy, 2020)对次高斯数据给出了严格的$O(\log n)$界。本文重点研究$\widehat{\pi}$的计算特性：我们提出一种算法，当$\varepsilon>0$足够小时，可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算得到$\widehat\pi$的Wasserstein距离$\varepsilon$-近似解。其中$K$与数据相关但与$\varepsilon$无关，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子数量。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有密度函数（相对于勒贝格测度）的概率分布独立采样生成时，这些保证几乎必然成立。我们进一步证明：当$\widehat\pi$被约束为$k$原子分布时，其条件分布在对应的$2k-1$维参数空间上存在密度函数（对所有$k\leq \sqrt{n}/3$成立），且EM算法几乎必然具有局部线性收敛性。关键工具之一是对非退化曲线的经典傅里叶分析估计。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：一个开放、快速、可靠且高效的每日任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过在多位置复制地址来实现降低延迟和增强韧性等目标。由于任播在现代互联网中的关键作用，先前研究已开发了执行任播普查的工具。首个工具iGreedy利用地理分散位置的延迟测量来绘制任播部署图；第二个工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查，但存在准确性和精确性问题。反之，iGreedy精度极高但速度较慢，且探测成本更高。本文针对这两个系统的缺陷提出了MAnycast Reloaded（MAnycastR）。以MAnycast2为基础，我们彻底重构了其测量流水线，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR，与外部任播生产部署对比，并通过RIPE Atlas进行广泛延迟测量，同时针对60%以上检测到的任播前缀与运营商真实数据进行交叉验证。结果表明MAnycastR实现了高准确性与精确度。我们将持续提供每日MAnycastR普查数据，并以宽松开源协议发布工具源代码。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：属性图上的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：给定图$G$和种子节点$v_s$，局部图聚类(LGC)的目标是在与$C_s$大小大致成线性关系的时间内，识别出围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图的应用场景。然而现有方案大多仅依赖图中节点的拓扑连接性，容易受到现实图数据中普遍存在的缺失或噪声链接的影响。为解决该问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC建模为双向扩散分布(BDD)的估计问题，该模型专门用于捕捉含属性节点的多跳关联性。进一步提出LACA方法——一种高效且具备强局部性的LGC解决方案，在多个真实数据集上表现出卓越性能。其核心组件包括：(i)快速且理论完备的节点属性预处理技术；(ii)具有严格理论保证和加速收敛特性的自适应向量扩散算法；(iii)高效的三步式BDD近似方案。通过在8个真实数据集上与17种对比方法的实验表明，LACA在真实局部簇的衡量标准下结果质量最优，同时速度可提升数个数量级。代码已开源在https://github.com/HaoranZ99/alac。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重构动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成了任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会新陈代谢系统。供应链网络绝非静态，而是通过企业的进出和供应关系的重组不断变化。本文利用独特数据集研究了一个国家供应链网络中企业及其供应商-客户关系的时间演化。基于匈牙利2014至2022年每月报告的增值税数据，我们重建了包含711,248家企业和38,644,400条连接的整体经济网络，以企业级分辨率覆盖了几乎整个经济体的所有重构事件。研究发现：每年约25%的企业退出供应链网络，同时28%的新企业加入；平均而言，当年存在的供应链接中有55%会在次年消失；供应链接的半衰期为13个月。新链接以超偏好概率$p(i)\propto k_i^{1.08}$依附企业（$k_i$表示企业i的供应连接数）。我们校准了一个能复现匈牙利主导供应链网络典型特征的简单统计网络生成模型，该模型不仅复现了入/出度分布、同配性和聚类结构等局部网络特征，还捕捉了真实的系统性风险特征。最后讨论了当前模型如何通过经济重连动态来量化其韧性和估计冲击传导。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数极大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：我们研究一维高斯位置混合的非参数极大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定n个数据点时该估计量始终返回最多含n个分量的混合分布，而近期(Wu-Polyanskiy, 2020)对亚高斯数据给出了严格的$O(\log n)$界。本文重点研究$\widehat{\pi}$的计算特性：提出一种算法，当$\varepsilon>0$足够小时，可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算得到$\widehat\pi$的Wasserstein距离$\varepsilon$-近似解。其中$K$与数据相关但与$\varepsilon$无关，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子数。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有密度函数（相对于Lebesgue测度）的概率分布独立采样生成时，这些保证几乎必然成立。进一步证明：当$k\leq \sqrt{n}/3$时，限定为k原子分布的$\widehat\pi$条件分布在相应$2k-1$维参数空间上存在密度函数，且EM算法几乎必然具有局部线性收敛性。关键工具之一是非退化曲线的经典傅里叶分析估计。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：一个开放、快速、可靠且高效的每日任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过在多位置复制地址来实现降低延迟和增强韧性等目标。由于任播在现代互联网中的关键作用，先前研究已开发了执行任播普查的工具。首个工具iGreedy利用地理分散节点的延迟测量来绘制任播部署图；第二个工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查，但存在准确性和精确度问题。相反，iGreedy精度极高但速度较慢，且探测成本更高。本文针对这两个系统的缺陷提出了MAnycast Reloaded（MAnycastR）。以MAnycast2为基础，我们彻底重构了其测量管道，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持，以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR，对比实际任播生产部署，并通过RIPE Atlas进行大规模延迟测量，同时将检测到的60%以上任播前缀与运营商真实数据交叉核验。结果表明MAnycastR具备高准确性与精确度。我们将持续提供每日MAnycastR普查数据，并以宽松开源协议发布工具源代码。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势（MLIPs）作为一种能够实现大规模、长时间原子尺度模拟的方法，同时保持与基于密度泛函理论（DFT）和第一性原理波函数理论的电子结构计算相当的精度，引起了广泛关注。然而，基于MLIP的分子动力学（MD）模拟面临的挑战是其稳定性低于使用传统经典势的模拟。分析高度异质体系或非晶材料通常需要大规模和长时间的模拟，因此需要开发能够实现稳定MD模拟的鲁棒MLIPs。在本研究中，我们利用自研的神经网络势（NNP）生成器，构建了一个NNP模型，能够在广泛水合水平下对全氟离聚物膜（Nafion）进行大规模、长时间的MD模拟。通过主动学习循环迭代扩展数据集，我们成功建立了鲁棒的深度势（DP）模型。具体而言，通过将非平衡 DPMD模拟采样的非平衡结构与结合最小原子间距的三维结构特征空间中的结构筛选相结合，可显著提升DP模型的鲁棒性，从而实现对约10,000至20,000个原子的大型Nafion体系进行长达31 ns的稳定MD模拟。采用所开发DP模型的MD模拟获得的氢原子自扩散系数，在广泛水合水平范围内比先前小体系的第一性原理 MD模拟结果更接近实验值。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：基于属性图的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：给定图$G$和种子节点$v_s$，局部图聚类(LGC)的目标是在与$C_s$大小大致成线性关系的时间内，识别出围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图数据的众多应用场景。然而，现有解决方案大多仅依赖图中节点的拓扑连接关系，容易受到现实图数据中普遍存在的缺失链接或噪声链接的影响。为解决这一问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC问题建模为双向扩散分布(BDD)的估计问题，该方法专门用于捕捉带属性节点的多跳关联性。进一步提出LACA算法——一种高效且具备强局部性的LGC解决方案，在多个真实数据集上展现出卓越性能。LACA的核心组件包括：(i)基于理论基础的快速节点属性预处理技术；(ii)具备严格理论保证和加速收敛特性的自适应向量扩散算法；(iii)有效的BDD近似三步骤方案。通过在8个真实数据集上与17种对比方法的实验表明，LACA在真实局部簇的衡量标准下结果质量最优，同时速度可提升数个数量级。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重构动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成了任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会新陈代谢系统。供应链网络绝非静态存在，而是通过企业的进出和供应关系的重组不断变化。本文利用独特数据集研究了一个国家供应链网络中企业及其供应商-采购商关系的时间演化。基于匈牙利2014至2022年每月报告的增值税数据，我们重建了包含711,248家企业和38,644,400条连接的整体经济网络，以企业级分辨率覆盖了几乎整个经济体的所有重构事件。研究发现：每年约25%的企业退出供应链网络，同时28%的新企业加入；平均而言，当年存在的供应链接中有55%会在次年消失；供应链接的半衰期为13个月。新链接以超偏好概率$p(i)\propto k_i^{1.08}$依附企业（$k_i$表示企业$i$的供应连接数）。我们校准了一个能复现匈牙利主导供应链网络典型特征的简单统计网络生成模型，该模型不仅复现了入/出度分布、同配性和聚类结构等局部网络特征，还捕捉了真实的系统性风险特征。最后讨论了当前模型如何通过经济重连动态来量化其韧性并评估冲击传导。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数极大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：我们研究一维高斯位置混合模型的非参数最大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定n个数据点时该估计量总是返回最多含n个分量的混合模型，而近期(Wu-Polyanskiy, 2020)对亚高斯数据给出了精确的$O(\log n)$界。本文重点研究$\widehat{\pi}$的计算特性：提出一种算法能在足够小的$\varepsilon>0$时，以$K+Cnk^2\log\log(1/\varepsilon)$时间计算Wasserstein距离下的$\varepsilon$近似解，其中$K$与数据相关但与$\varepsilon$无关，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子数。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$来自具有密度（相对于Lebesgue测度）的概率分布时，这些保证几乎必然成立。同时证明：当$k\leq \sqrt{n}/3$时，限定为k原子分布的$\widehat\pi$在其$2k-1$维参数空间上存在密度，且EM算法几乎必然具有局部线性收敛性。关键工具之一是对非退化曲线的经典傅里叶分析估计。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：一个开放、快速、可靠且高效的每日任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过在多位置复制地址来实现降低延迟和增强韧性等目标。由于任播在现代互联网中的关键作用，先前研究已开发了执行任播普查的工具。首个工具iGreedy利用地理分散节点的延迟测量来绘制任播部署图；第二个工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查，但存在准确性和精确性问题。相反，iGreedy精度极高但速度较慢，且探测成本更高。本文针对这两个系统的缺陷提出了MAnycast Reloaded（MAnycastR）。以MAnycast2为基础，我们彻底重构了其测量流水线，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR，对比实际任播生产部署，并通过RIPE Atlas进行大规模延迟测量，同时将检测到的60%以上任播前缀与运营商真实数据进行交叉验证。结果表明MAnycastR具备高准确性和精确性。我们以宽松开源协议发布工具源代码，并向社区提供持续的每日MAnycastR普查数据。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势（MLIPs）作为一种能够实现大规模、长时间原子尺度模拟的方法，同时保持与基于密度泛函理论（DFT）和从头算波函数理论的电子结构计算相当的精度，引起了广泛关注。然而，基于MLIP的分子动力学（MD）模拟面临的挑战是其稳定性低于使用传统经典势的模拟。分析高度异质体系或非晶材料通常需要大规模和长时间的模拟，因此需要开发能够实现稳定MD模拟的鲁棒性MLIP。在本研究中，我们利用自研的神经网络势（NNP）生成器，构建了一个NNP模型，该模型能够在广泛水合水平范围内对全氟磺酸离聚物膜（Nafion）进行大规模、长时间的MD模拟。通过主动学习循环迭代扩展数据集，我们成功建立了鲁棒的深度势（DP）模型。具体而言，通过将非平衡 DPMD模拟采样的非平衡结构与结合最小原子间距的三维结构特征空间中的结构筛选相结合，可显著提升DP模型的鲁棒性，从而实现对约10,000至20,000个原子的大型Nafion体系进行长达31 ns的稳定MD模拟。采用所开发DP模型的MD模拟获得的氢原子自扩散系数，在广泛水合水平范围内比先前小体系从头算MD模拟结果更接近实验值。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：属性图上的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：给定图$G$和种子节点$v_s$，局部图聚类（LGC）的目标是在与$C_s$大小近似线性时间内识别出围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图的应用场景。然而现有方案大多仅依赖图中节点的拓扑连接性，容易受到现实图谱中普遍存在的缺失边或噪声边的影响。为此，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC建模为双向扩散分布（BDD）估计问题，该模型专门用于捕捉带属性节点的多跳关联性。进一步提出LACA方法，其核心组件包括：(i) 基于理论基础的快速节点属性预处理技术；(ii) 具有严格理论保证和加速收敛特性的自适应向量扩散算法；(iii) 高效的BDD近似三步骤方案。在8个真实数据集上与17种方法的对比实验表明，LACA在真实局部簇的评估指标上全面超越现有方法，同时速度提升达数量级。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重构动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成了任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会新陈代谢系统。SCN绝非静态存在，而是通过企业的进出和供应关系的重组持续演变。本研究利用独特数据集追踪了一个国家SCN中企业及其供应商-客户关系的时间演化。基于匈牙利2014至2022年每月增值税数据，我们重建了包含711,248家企业和38,644,400条连接的完整经济网络，以企业级分辨率捕捉了整个经济体的每次重构事件。研究发现：每年约25%企业退出SCN，同时28%新企业加入；平均55%的年度供应关系会在次年消失；供应关系的半衰期为13个月。新连接以超偏好依附概率$p(i)\propto k_i^{1.08}$（$k_i$为企业i的连接数）形成。我们校准的简单统计网络生成模型成功复现了匈牙利主导SCN的特征模式，不仅能重现入/出度分布、同配性和聚类结构等局部特征，还能捕捉真实的系统性风险轮廓。该模型揭示了经济网络重连动态对量化系统韧性和估计冲击传导的关键作用。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数极大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：我们研究一维高斯位置混合模型的非参数极大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定n个数据点时该估计量总是返回最多含n个分量的混合模型，而近期(Wu-Polyanskiy, 2020)对亚高斯数据给出了严格的$O(\log n)$界。本文研究$\widehat{\pi}$的计算特性：提出一种算法，当$\varepsilon>0$足够小时，可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算得到$\widehat\pi$的Wasserstein距离$\varepsilon$-近似解。其中$K$与数据相关但与$\varepsilon$无关，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子数。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$来自具有密度（相对于Lebesgue测度）的概率分布时，这些保证几乎必然成立。我们还证明：当$k\leq \sqrt{n}/3$时，限定为k原子的$\widehat\pi$条件分布在相应$2k-1$维参数空间上存在密度，且EM算法几乎必然具有局部线性收敛性。关键工具之一是对非退化曲线的经典傅里叶分析估计。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：一个开放、快速、可靠且高效的每日任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过在多位置复制地址来实现降低延迟和增强韧性等目标。由于任播在现代互联网中的关键作用，先前研究已开发了执行任播普查的工具。首个工具iGreedy利用地理分散位置的延迟测量来映射任播部署；第二个工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查，但存在准确性和精确度问题。相反，iGreedy精度极高但速度较慢，且探测成本更高。本文针对这两个系统的缺陷，提出了MAnycast Reloaded（MAnycastR）。以MAnycast2为基础，我们彻底重新设计了其测量管道，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持，以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR，与外部任播生产部署进行对比，通过RIPE Atlas进行广泛延迟测量，并对检测到的60%以上任播前缀与运营商真实数据进行交叉验证。结果表明MAnycastR实现了高准确性和精确度。我们将持续提供每日MAnycastR普查数据，并以宽松开源协议发布工具源代码。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势（MLIPs）作为一种能够实现大规模、长时间原子模拟并保持与基于密度泛函理论（DFT）和从头算波函数理论的电子结构计算相当精度的方法，引起了广泛关注。然而，基于MLIP的分子动力学（MD）模拟面临的挑战是其稳定性低于使用传统经典势的模拟。分析高度异质体系或非晶材料通常需要大规模和长时间的模拟，因此需要开发能够实现稳定MD模拟的鲁棒MLIP。在本研究中，我们利用神经网络势（NNP）生成器，构建了一个NNP模型，能够在广泛水合水平下对全氟离子交换膜（Nafion）进行大规模、长时间的MD模拟。通过主动学习循环迭代扩展数据集，我们成功建立了深度势（DP）模型。具体而言，通过将非平衡DPMD模拟采样的非平衡结构与结合最小原子间距的三维结构特征空间中的结构筛选相结合，可以显著增强DP模型的鲁棒性，从而实现对约10,000至20,000个原子的大型Nafion体系进行长达31 ns的稳定MD模拟。采用所开发DP模型的MD模拟获得的氢原子自扩散系数，在广泛水合水平范围内与实验值的吻合度优于先前对小体系进行的从头算MD模拟结果。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：基于属性图的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：给定图$G$和种子节点$v_s$，局部图聚类（LGC）的目标是在与$C_s$大小大致成线性关系的时间内，识别出围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图的应用场景。然而现有方案大多仅依赖图中节点的拓扑连接性，容易受到现实图谱中普遍存在的缺失或噪声链接的影响。为解决该问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC建模为双向扩散分布（BDD）的估计问题——该模型专为捕捉带属性节点的多跳亲和力而设计。进一步提出LACA方法，其核心组件包括：（i）基于理论基础的快速节点属性预处理技术；（ii）具备严格理论保证且加速收敛的自适应向量扩散算法；（iii）高效的三步式BDD近似方案。在8个真实数据集上与17种方法的对比实验表明，LACA在真实局部簇的评估指标上全面优于所有对比方法，同时速度提升达数量级。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重构动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会代谢系统。SCN绝非静态存在，而是通过企业的进出与供应关系的重组持续演变。本研究利用独特数据集追踪了一个国家SCN中企业及其供应商-客户关系的时间演化。基于匈牙利2014至2022年每月增值税数据，我们重构了包含711,248家企业和38,644,400条连接的完整经济网络，以企业级分辨率捕捉了整个经济体的每次重构事件。研究发现：每年约25%的企业退出SCN，同时28%的新企业加入；平均55%的现存供应链接会在次年消失；供应链接的半衰期为13个月。新链接以超偏好依附概率$p(i)\propto k_i^{1.08}$（$k_i$为企业i的供应连接数）附着于企业。我们校准的简单统计网络生成模型成功复现了匈牙利主导SCN的典型特征，不仅能再现入/出度分布、同配性和聚类结构等局部网络特征，还能捕捉真实的系统性风险轮廓。最后探讨了该模型如何通过经济重连动态来量化系统韧性及评估冲击传导。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数最大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：我们研究一维高斯位置混合模型的非参数极大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定n个数据点时该估计量始终返回最多含n个混合模型的分量，而近期(Wu-Polyanskiy, 2020)对亚高斯数据给出了精确的$O(\log n)$界。本文重点研究$\widehat{\pi}$的计算特性：提出一种算法，当$\varepsilon>0$足够小时，可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算出Wasserstein距离意义下的$\varepsilon$近似解，其中$K$与数据相关但与$\varepsilon$无关，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子数量。我们还能在有限时间内可验证地计算出$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有密度函数（相对于Lebesgue测度）的概率分布独立采样生成时，这些保证几乎必然成立。我们还证明：当$k\leq \sqrt{n}/3$时，限定为k原子结构的$\widehat\pi$条件分布在相应$2k-1$维参数空间上存在密度函数，且EM算法几乎必然具有局部线性收敛性。关键工具之一是关于非退化曲线的经典傅里叶分析估计。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：一个开放、快速、可靠且高效的每日任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过将地址复制到多个位置来实现（例如）降低延迟和增强韧性。由于任播在现代互联网中的关键作用，先前研究引入了执行任播普查的工具。首个工具iGreedy利用地理分散位置的延迟测量来映射任播部署；第二个工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查，但存在准确性和精确性问题。相反，iGreedy精度极高但速度较慢，且探测成本更高。本文针对这两个系统的缺陷提出了MAnycast Reloaded（MAnycastR）。以MAnycast2为基础，我们彻底重构了其测量流水线，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持，以及类似iGreedy的延迟测量功能。我们在包含32个全球分布式节点的任播测试平台上验证MAnycastR，与外部任播生产部署进行对比，并通过RIPE Atlas进行广泛延迟测量，同时针对60%以上检测到的任播前缀与运营商真实数据进行交叉验证。结果表明MAnycastR实现了高准确性和精确性。我们将持续提供每日MAnycastR普查数据，并以宽松的开源许可协议发布该工具源代码。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势（MLIPs）作为一种能够实现大规模、长时间原子尺度模拟的方法，同时保持与基于密度泛函理论（DFT）和从头算波函数理论的电子结构计算相当的精度，引起了广泛关注。然而，基于MLIP的分子动力学（MD）模拟面临的一个挑战是，与传统经典势相比其稳定性较低。分析高度异质体系或非晶材料通常需要大规模和长时间的模拟，因此需要开发能够实现稳定MD模拟的鲁棒MLIP。在本研究中，我们利用自研的神经网络势（NNP）生成器，构建了一个NNP模型，能够在广泛水合水平下对全氟磺酸离子膜（Nafion）进行大规模、长时间的MD模拟。通过主动学习循环迭代扩展数据集，我们成功建立了鲁棒的深度势（DP）模型。具体而言，通过将非平衡 DPMD模拟采样的非平衡结构与结合最小原子间距的三维结构特征空间中的结构筛选相结合，可显著提升DP模型的鲁棒性，从而实现对约10,000至20,000个原子的大型Nafion体系进行长达31 ns的稳定MD模拟。采用所开发DP模型的MD模拟获得的氢原子自扩散系数，在广泛水合水平范围内与实验值的吻合度较先前小体系从头算MD模拟有显著提升。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：属性图上的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：给定图$G$和种子节点$v_s$，局部图聚类（LGC）的目标是在与$C_s$大小大致成线性关系的时间内，识别出围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图的应用场景。然而，现有解决方案大多仅依赖图中节点的拓扑连接性，容易受到现实图数据中普遍存在的缺失或噪声链接的影响。为解决该问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC建模为双向扩散分布（BDD）的估计问题，该模型专门用于捕捉含属性节点的多跳关联性。进一步提出LACA方法——一种高效且具备严格理论保证的LGC方案，其核心包括：(i) 基于理论基础的快速节点属性预处理技术；(ii) 具有自适应扩散能力和加速收敛特性的向量传播算法；(iii) 高效的三步式BDD近似策略。在8个真实数据集上与17种对比方法的实验表明，LACA在真实局部簇的评估指标上全面优于所有基线方法，同时实现数量级的速度提升。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重构动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成了任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会新陈代谢系统。SCN绝非静态存在，而是通过企业的进出和供应关系的重组持续演变。本研究利用独特数据集追踪了一个国家SCN中企业及其供应商-客户关系的时间演化。基于匈牙利2014至2022年每月报告的增值税数据，我们重建了包含711,248家企业和38,644,400条连接的完整经济网络，以企业级分辨率捕捉了整个经济体的每次重构事件。研究发现：每年约25%的企业退出SCN，同时28%的新企业加入；平均55%的年度供应关系会在次年消失；供应关系的半衰期为13个月。新连接以超偏好依附概率$p(i)\propto k_i^{1.08}$（$k_i$表示企业i的供应连接数）附着于企业。我们校准了一个能复现匈牙利主导SCN典型特征的简易统计网络生成模型，该模型不仅再现了入度/出度分布、同配性和聚类结构等局部网络特征，还捕捉了真实的系统性风险特征。最后探讨了经济重连动态对量化系统韧性和估计冲击传导的关键作用。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数极大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：我们研究一维高斯位置混合模型的非参数最大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定n个数据点时，该估计量始终返回最多含n个分量的混合模型，而近期(Wu-Polyanskiy, 2020)对亚高斯数据给出了精确的$O(\log n)$界。本文重点研究$\widehat{\pi}$的计算特性：我们提出一种算法，当$\varepsilon>0$足够小时，可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算得到$\widehat\pi$的Wasserstein距离$\varepsilon$-近似解，其中$K$与数据相关但与$\varepsilon$无关，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子数量。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有密度（相对于Lebesgue测度）的概率分布独立采样生成时，这些保证几乎必然成立。我们进一步证明：当$\widehat\pi$被约束为k原子分布时，对所有$k\leq \sqrt{n}/3$，其在相应$2k-1$维参数空间上存在密度，且EM算法几乎必然具有局部线性收敛性。关键工具之一是对非退化曲线的经典傅里叶分析估计。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：一个开放、快速、可靠且高效的每日任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过将地址复制到多个位置来实现（例如）降低延迟和增强韧性。由于任播在现代互联网中的关键作用，先前研究已开发了执行任播普查的工具。首个工具iGreedy利用地理分散位置的延迟测量来映射任播部署；第二个工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查，但存在准确性和精确性问题。相反，iGreedy精度极高但速度较慢，且探测成本更高。本文针对这两个系统的缺陷提出了MAnycast Reloaded（MAnycastR）。基于MAnycast2，我们彻底重构了其测量流水线，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR，与外部任播生产部署对比，并通过RIPE Atlas进行大规模延迟测量，同时将检测到的60%以上任播前缀与运营商真实数据交叉核验。结果表明MAnycastR实现了高准确性与精确度。我们以宽松开源协议向社区提供每日持续的MAnycastR普查数据，并公开该工具的源代码。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子间势的聚合物电解质膜质子传输大规模长时原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势（MLIPs）作为一种能够实现大规模、长时间原子模拟并保持与基于密度泛函理论（DFT）和从头算波函数理论的电子结构计算相当精度的方法，引起了广泛关注。然而，基于MLIP的分子动力学（MD）模拟面临的关键挑战是其稳定性低于传统经典势函数。分析高度异质体系或非晶材料通常需要大规模长时间模拟，这要求开发能够实现稳定MD模拟的鲁棒性MLIP。本研究利用自研神经网络势（NNP）生成器，构建了可在广泛水合度范围内对全氟离聚物膜（Nafion）进行大规模长时间MD模拟的NNP模型。通过主动学习循环迭代扩展数据集，我们成功建立了鲁棒的深度势（DP）模型。具体而言，通过将非平衡态 DPMD模拟采样的非平衡结构与融合最小原子间距的三维结构特征空间筛选相结合，可显著提升DP模型的鲁棒性，从而实现对约10,000至20,000原子的大型Nafion体系持续31纳秒的稳定MD模拟。采用所开发DP模型的MD模拟获得的氢原子自扩散系数，在宽水合度范围内比先前小体系从头算MD模拟结果更接近实验值。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：基于属性图的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：给定图$G$和种子节点$v_s$，局部图聚类(LGC)的目标是在与$C_s$大小近似线性时间内识别围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图的应用场景。然而现有方案大多仅依赖图中节点的拓扑连接性，容易受到现实图数据中普遍存在的缺失或噪声链接的影响。为解决该问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC建模为双向扩散分布(BDD)的估计问题——该分布专门用于捕捉带属性节点的多跳关联性。进一步提出LACA方法，其核心组件包括：(i)基于理论基础的快速节点属性预处理技术；(ii)具备理论保证和加速收敛特性的自适应向量扩散算法；(iii)高效的BDD近似三步骤方案。在8个真实数据集上与17种方法的对比实验表明，LACA在真实局部簇的评估指标上全面优于所有对比方法，同时实现数量级的速度提升。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重构动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会新陈代谢系统。SCN绝非静态存在，而是通过企业的进出与供应关系的重组持续演变。本研究利用独特数据集追踪了一个国家SCN中企业及其供需关系的时序演化。基于匈牙利2014至2022年每月报告的增值税数据，我们重构了包含711,248家企业和38,644,400条连接的完整经济网络，以企业级分辨率捕捉了整个经济体的每次重构事件。研究发现：每年约25%的企业退出SCN，同时28%的新企业加入；平均55%的现存供应链接会在次年消失；供应链接的半衰期为13个月。新链接以超偏好依附概率$p(i)\propto k_i^{1.08}$（$k_i$表示企业i的供应连接数）附着于企业。我们校准了一个能复现匈牙利主导SCN典型特征的简易统计网络生成模型，该模型不仅重现了入/出度分布、同配性和聚类结构等局部网络特征，还捕捉了真实的系统性风险轮廓。最后探讨了经济重连动态对量化系统韧性和估计冲击传导的关键作用。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数最大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：我们研究一维高斯位置混合模型的非参数极大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定n个数据点时，该估计量总是返回最多含n个分量的混合模型，而近期(Wu-Polyanskiy, 2020)对次高斯数据给出了精确的$O(\log n)$界。本文重点研究$\widehat{\pi}$的计算特性：我们提出一种算法，当$\varepsilon>0$足够小时，可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算出Wasserstein距离意义上的$\varepsilon$近似解，其中$K$与数据相关但与$\varepsilon$无关，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子数量。我们还可在有限时间内确定性计算出$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$来自具有密度（相对于Lebesgue测度）的概率分布时，这些保证几乎必然成立。我们进一步证明：当$k\leq \sqrt{n}/3$时，限定为k原子性的$\widehat\pi$条件分布在相关$2k-1$维参数空间上存在密度，且EM算法几乎必然具有局部线性收敛性。关键工具之一是针对非退化曲线的经典傅里叶分析估计。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：开放、快速、可靠且高效的日常任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过在多位置复制地址来实现降低延迟和增强韧性等目标。由于任播在现代互联网中的关键作用，先前研究已开发了执行任播普查的工具。首个工具iGreedy利用地理分散节点的延迟测量来绘制任播部署图；第二个工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查，但存在准确性和精确度问题。相反，iGreedy精度极高但速度较慢，且探测成本更高。本文针对这两个系统的缺陷，提出了MAnycast Reloaded（MAnycastR）。以MAnycast2为基础，我们彻底重构了其测量管道，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR，对比外部任播生产部署，通过RIPE Atlas进行广泛延迟测量，并将检测到的60%以上任播前缀与运营商真实数据交叉核验。结果表明MAnycastR实现了高准确性与精确度。我们以宽松开源协议发布工具源码，并向社区提供持续的每日MAnycastR普查数据。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势（MLIPs）作为一种能够实现大规模、长时间原子模拟并保持与基于密度泛函理论（DFT）和从头算波函数理论的电子结构计算相当精度的方法，受到了广泛关注。然而，基于MLIP的分子动力学（MD）模拟面临的关键挑战是其稳定性低于传统经典势函数。分析高度异质体系或非晶材料通常需要大规模长时间模拟，因此亟需开发能够支持稳定MD模拟的鲁棒性MLIP。本研究利用自主开发的神经网络势（NNP）生成器，构建了可在广泛水合水平范围内对全氟离聚物膜（Nafion）进行大规模长时间MD模拟的NNP模型。通过主动学习循环迭代扩展数据集，我们成功建立了鲁棒的深度势（DP）模型。具体而言，通过将非平衡态 DPMD模拟采样的非平衡结构与融合最小原子间距的三维结构特征空间筛选相结合，显著提升了DP模型的鲁棒性，使得对约10,000至20,000个原子的大规模Nafion体系进行长达31纳秒的稳定MD模拟成为可能。采用所开发DP模型的MD模拟获得的氢原子自扩散系数，在广泛水合水平范围内比先前小体系从头算MD模拟结果更接近实验值。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：属性图上的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：给定图$G$和种子节点$v_s$，局部图聚类（LGC）的目标是在与$C_s$大小大致成线性关系的时间内，识别出围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，使其非常适用于涉及大规模图的众多应用场景。然而，现有解决方案大多仅依赖图中节点的拓扑连接性，容易受到现实图数据中普遍存在的缺失链接或噪声链接的影响。为解决这一问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC建模为双向扩散分布（BDD）的估计问题，该模型专门用于捕捉含属性节点的多跳关联性。进一步提出LACA方法——一种高效且具备严格理论保证的LGC解决方案，其核心组件包括：(i) 基于理论基础的快速节点属性预处理技术，(ii) 具有自适应扩散能力和加速收敛特性的向量传播算法， (iii) 高效的三步式BDD近似方案。通过在8个真实数据集上与17种对比方法的实验表明，LACA在真实局部簇的评估指标上全面优于所有对比方法，同时速度提升达数量级。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重构动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会新陈代谢系统。SCN绝非静态存在，而是通过企业的进出和供应关系的重组持续演变。本文利用独特数据集研究了一个国家SCN中企业及其供应商-买方关系的时间演化。基于匈牙利2014至2022年按月申报的增值税数据，我们重建了包含711,248家企业和38,644,400条连接的整体经济网络，以企业级分辨率覆盖了几乎整个经济体的所有重构事件。研究发现：每年约25%的企业退出SCN，同时28%的新企业加入；平均55%的现存供应链接会在次年消失；供应链接的半衰期为13个月。新链接以超偏好概率$p(i)\propto k_i^{1.08}$依附企业（$k_i$表示企业i的供应连接数）。我们校准了一个能复现匈牙利主导SCN典型特征的简易统计网络生成模型，该模型不仅重现了入/出度分布、同配性和聚类结构等局部网络特征，还捕捉了真实的系统性风险轮廓。最后讨论了经济重连动态对量化系统韧性和估计冲击传导的关键作用。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数最大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：我们研究一维高斯位置混合模型的非参数极大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定n个数据点时该估计量总是返回最多含n个分量的混合模型，而近期(Wu-Polyanskiy, 2020)对亚高斯数据给出了精确的$O(\log n)$界。本文研究$\widehat{\pi}$的计算特性：我们提出一种算法，当$\varepsilon>0$足够小时，可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算出Wasserstein距离意义上的$\varepsilon$近似解，其中$K$与数据相关但与$\varepsilon$无关，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子数量。我们还可在有限时间内确定性计算出$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有密度函数（相对于Lebesgue测度）的概率分布独立采样生成时，这些保证几乎必然成立。我们还证明：当$k\leq \sqrt{n}/3$时，限定为k原子的$\widehat\pi$条件分布在对应的$2k-1$维参数空间上存在密度函数，且EM算法几乎必然具有局部线性收敛性。关键工具之一是针对非退化曲线的经典傅里叶分析估计。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：一个开放、快速、可靠且高效的每日任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过将地址复制到多个位置来实现（例如）降低延迟和增强韧性。由于任播在现代互联网中的关键作用，先前研究已引入执行任播普查的工具。首个工具iGreedy利用地理分散位置的延迟测量来映射任播部署；第二个工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查，但存在准确性和精确性问题。相反，iGreedy精度极高但速度较慢，且探测成本更高。本文针对这两个系统的缺陷，提出了MAnycast Reloaded（MAnycastR）。以MAnycast2为基础，我们彻底重新设计了其测量流水线，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持，以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR，与外部任播生产部署对比，并通过RIPE Atlas进行广泛延迟测量，同时将检测到的60%以上任播前缀与运营商真实数据交叉核验。结果表明MAnycastR实现了高准确性与精确度。我们以宽松开源协议向社区提供每日持续的MAnycastR普查数据，并公开该工具的源代码。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势（MLIPs）作为一种能够实现大规模、长时间原子尺度模拟的方法，同时保持与基于密度泛函理论（DFT）和第一性原理波函数理论的电子结构计算相当的精度，引起了广泛关注。然而，基于MLIP的分子动力学（MD）模拟面临的一个挑战是，与传统经典势相比其稳定性较低。分析高度异质体系或非晶材料通常需要大规模和长时间的模拟，因此需要开发能够实现稳定MD模拟的鲁棒性MLIPs。在本研究中，我们利用自研的神经网络势（NNP）生成器，构建了一个NNP模型，该模型能够对不同水合水平的全氟离聚物膜（Nafion）进行大规模、长时间的MD模拟。通过主动学习循环迭代扩展数据集，我们成功建立了鲁棒的深度势（DP）模型。具体而言，通过将非平衡DPMD模拟采样的非平衡结构与结合最小原子间距的三维结构特征空间中的结构筛选相结合，可以显著增强DP模型的鲁棒性，从而实现对约10,000至20,000个原子的大型Nafion体系进行长达31 ns的稳定MD模拟。采用所开发DP模型进行的MD模拟获得的氢原子自扩散系数，与先前较小体系的第一性原理 MD模拟相比，在更广泛的水合水平范围内与实验值更为吻合。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：属性图上的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：给定图$G$和种子节点$v_s$，局部图聚类(LGC)的目标是在与$C_s$大小大致成线性关系的时间内，识别出围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图的应用场景。然而，现有解决方案大多仅依赖图中节点的拓扑连接关系，容易受到现实图数据中普遍存在的缺失链接或噪声链接的影响。为解决这一问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC问题建模为双向扩散分布(BDD)的估计问题，该模型专门用于捕捉含属性图中节点的多跳关联性。进一步提出LACA方法——一种高效且具备严格理论保证的LGC解决方案：其核心组件包括(i)快速且理论完备的节点属性预处理技术，(ii)具有理论收敛保证的自适应向量扩散算法，(iii)高效的三步式BDD近似方案。通过在8个真实数据集上与17种对比方法的实验表明，LACA在真实局部簇的衡量标准下均优于所有对比方法，同时速度提升达数量级。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重构动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成了任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会新陈代谢系统。SCN绝非静态存在，而是通过企业的进出和供应关系的重组持续演变。本文利用独特数据集研究了一个国家SCN中企业及其供应商-客户关系的时间演化。基于匈牙利2014至2022年每月报告的增值税数据，我们重建了包含711,248家企业和38,644,400条连接的整体经济网络，以企业级分辨率覆盖了几乎所有的经济重构事件。研究发现：每年约25%的企业退出SCN，同时28%的新企业加入；平均55%的年度供应关系会在次年消失；供应关系的半衰期为13个月。新连接以超偏好概率$p(i)\propto k_i^{1.08}$依附企业（$k_i$表示企业i的供应连接数）。我们校准了一个能复现匈牙利主导SCN典型特征的简单统计网络生成模型，该模型不仅再现了入度/出度分布、同配性和聚类结构等局部网络特征，还捕捉了真实的系统性风险轮廓。最后讨论了经济重连动态对量化系统韧性和估计冲击传导的关键作用。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数最大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：我们研究一维高斯位置混合模型的非参数最大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定n个数据点时，该估计量始终返回最多含n个分量的混合模型，而近期(Wu-Polyanskiy, 2020)对亚高斯数据给出了严格的$O(\log n)$界。本研究聚焦$\widehat{\pi}$的计算特性：我们提出一种算法，当$\varepsilon>0$足够小时，可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算得到$\widehat\pi$的Wasserstein距离$\varepsilon$-近似解。其中$K$与数据相关但独立于$\varepsilon$，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子数量。我们还实现了支撑集大小$|supp(\widehat\pi)|$的有限时间可验证计算。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有密度（相对于Lebesgue测度）的概率分布独立采样生成时，这些保证几乎必然成立。我们进一步证明：对于所有$k\leq \sqrt{n}/3$，限定为k原子结构的$\widehat\pi$条件分布在相应$2k-1$维参数空间上具有密度，且EM算法几乎必然具有局部线性收敛性。关键工具之一是对非退化曲线的经典傅里叶分析估计。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：一个开放、快速、可靠且高效的每日任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过在多位置复制地址来实现降低延迟和增强韧性等目标。由于任播在现代互联网中的关键作用，先前研究已开发了执行任播普查的工具。首个工具iGreedy利用地理分散位置的延迟测量来映射任播部署；第二个工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查，但存在准确性和精确性问题。相反，iGreedy精度极高但速度较慢，且探测成本更高。本文针对这两个系统的缺陷提出了MAnycast Reloaded（MAnycastR）。以MAnycast2为基础，我们彻底重新设计了其测量管道，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持，以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR，与外部任播生产部署进行对比，并通过RIPE Atlas进行广泛延迟测量，同时对检测到的60%以上任播前缀进行运营商真实数据交叉验证。结果表明MAnycastR实现了高准确性与精确度。我们将持续提供每日MAnycastR普查数据，并以宽松开源协议发布工具源代码。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势（MLIPs）作为一种能够实现大规模、长时间原子模拟并保持与基于密度泛函理论（DFT）和从头算波函数理论的电子结构计算相当精度的方法，引起了广泛关注。然而，基于MLIP的分子动力学（MD）模拟面临的挑战是其稳定性低于使用传统经典势的模拟。分析高度异质体系或非晶材料通常需要大规模和长时间的模拟，因此需要开发能够实现稳定MD模拟的鲁棒MLIP。在本研究中，我们利用自研的神经网络势（NNP）生成器，构建了一个NNP模型，该模型能够对全氟磺酸离聚物膜（Nafion）在不同水合水平下进行大规模、长时间的MD模拟。通过主动学习循环迭代扩展数据集，我们成功建立了鲁棒的深度势（DP）模型。具体而言，通过将非平衡DPMD模拟采样的非平衡结构与结合最小原子间距的三维结构特征空间中的结构筛选相结合，可显著提升DP模型的鲁棒性，从而实现对约10,000至20,000个原子的大型Nafion体系进行长达31 ns的稳定MD模拟。采用所开发DP模型的MD模拟获得的氢原子自扩散系数，在广泛水合水平范围内比先前小体系从头算MD模拟结果更接近实验值。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：属性图上的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：摘要：给定图$G$和种子节点$v_s$，局部图聚类（LGC）的目标是在与$C_s$大小近似线性相关的时间内，识别出围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图的应用场景。然而，现有解决方案大多仅依赖图中节点的拓扑连接关系，容易受到现实图数据中普遍存在的缺失链接或噪声链接的影响。为解决该问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC建模为双向扩散分布（BDD）的估计问题，该模型专门用于捕捉带属性节点的多跳关联性。进一步提出LACA方法——一种高效且具备严格理论保证的LGC解决方案，其核心包括：(i) 快速且理论完备的节点属性预处理技术，(ii) 具有理论收敛保证的自适应向量扩散算法，(iii) 高效的三步式BDD近似方案。在8个真实数据集上与17种基线方法的对比实验表明，LACA在真实局部簇的评估指标上全面优于所有对比方法，同时速度提升达数量级。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：Supply chain network rewiring dynamics at the firm-level
中文标题：企业层面的供应链网络重构动态
发布日期：2025-03-26 14:42:44+00:00
作者：Tobias Reisch, András Borsos, Stefan Thurner
分类：econ.GN, nlin.AO, physics.soc-ph, q-fin.EC
原文链接：http://arxiv.org/abs/2503.20594v1

中文摘要：供应链网络（SCN）构成任何社会的结构性支柱。它们通过协调地球上几乎每一个个体，形成了为所有人生产一切的社会新陈代谢系统。SCN绝非静态存在，而是通过企业的进出与供应关系的重组持续演变。本研究利用独特数据集追踪了一个国家SCN中企业及其供需关系的时序演化。基于匈牙利2014至2022年每月报告的增值税数据，我们重建了包含711,248家企业和38,644,400条连接的完整经济网络，以企业级分辨率捕捉了整个经济体的每次重构事件。研究发现：每年约25%的企业退出SCN，同时28%的新企业加入；平均55%的年度供应关系会在次年消失；供应关系的半衰期为13个月。新连接以超偏好依附方式链接企业，概率满足$p(i)\propto k_i^{1.08}$（$k_i$表示企业i的供应连接数）。我们校准的简易统计网络生成模型成功复现了匈牙利主导SCN的典型特征，不仅能重现入/出度分布、同配性和聚类结构等局部网络特征，还可捕捉真实的系统性风险轮廓。该模型揭示了经济网络重连动态对量化系统韧性和估计冲击传导的关键作用。

摘要

原文标题：Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior
中文标题：高斯位置混合的非参数最大似然估计：可验证计算与通用行为
发布日期：2025-03-26 03:36:36+00:00
作者：Yury Polyanskiy, Mark Sellke
分类：math.ST, stat.ML, stat.TH
原文链接：http://arxiv.org/abs/2503.20193v1

中文摘要：我们研究一维高斯位置混合的非参数极大似然估计量$\widehat{\pi}$。自(Lindsay, 1983)以来已知，给定n个数据点时该估计量始终返回最多含n个混合分布的分量，而近期(Wu-Polyanskiy, 2020)对亚高斯数据给出了严格的$O(\log n)$界。本文研究$\widehat{\pi}$的计算特性：提出一种算法，当$\varepsilon>0$足够小时，可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算得到$\widehat\pi$的Wasserstein距离$\varepsilon$-近似解。其中$K$与数据相关但独立于$\varepsilon$，$C$为绝对常数，$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子数。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有密度函数（相对于Lebesgue测度）的概率分布独立采样时，这些保证几乎必然成立。同时证明：当$k\leq \sqrt{n}/3$时，限定为k原子分布的$\widehat\pi$条件分布在相应$2k-1$维参数空间上存在密度函数，且EM算法几乎必然具有局部线性收敛性。关键工具之一是对非退化曲线的经典傅里叶分析估计。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：开放、快速、可靠且高效的每日任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过将地址复制到多个位置来实现（例如）降低延迟和增强韧性。由于任播在现代互联网中的关键作用，先前研究已开发了执行任播普查的工具。首个工具iGreedy利用地理分散位置的延迟测量来映射任播部署；第二个工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查，但存在准确性和精确度问题；而iGreedy虽然高度准确，但速度较慢且探测成本更高。本文针对这两个系统的缺陷，提出了MAnycast Reloaded（MAnycastR）。我们以MAnycast2为基础，彻底重构其测量流水线，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持以及类似iGreedy的延迟测量功能。通过在含32个全球分布式节点的任播测试床上验证MAnycastR，对比外部任播生产部署和RIPE Atlas的大规模延迟测量数据，并对检测到的60%以上任播前缀进行运营商真实数据交叉检验，证明MAnycastR具备高准确性和精确度。我们将持续提供每日MAnycastR普查数据，并以宽松开源协议发布工具源代码。

摘要

原文标题：Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential
中文标题：基于神经网络原子间势的聚合物电解质膜质子传输大规模长时原子模拟
发布日期：2025-03-26 10:40:30+00:00
作者：Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai
分类：cond-mat.mtrl-sci, physics.comp-ph
原文链接：http://arxiv.org/abs/2503.20412v1

中文摘要：近年来，机器学习原子间势（MLIPs）作为一种能够实现大规模、长时间原子模拟并保持与基于密度泛函理论（DFT）和从头算波函数理论的电子结构计算相当精度的方法，引起了广泛关注。然而，基于MLIP的分子动力学（MD）模拟面临的挑战是其稳定性低于使用传统经典势的模拟。分析高度异质体系或非晶材料通常需要大规模和长时间的模拟，因此需要开发能够实现稳定MD模拟的鲁棒MLIP。在本研究中，我们利用自研的神经网络势（NNP）生成器，构建了一个NNP模型，能够在广泛水合水平下对全氟磺酸离子膜（Nafion）进行大规模、长时间的MD模拟。通过主动学习循环迭代扩展数据集，我们成功建立了鲁棒的深度势（DP）模型。具体而言，通过将非平衡DPMD模拟采样的非平衡结构与结合最小原子间距的三维结构特征空间中的结构筛选相结合，可显著提升DP模型的鲁棒性，从而实现对约10,000至20,000个原子的大型Nafion体系进行长达31 ns的稳定MD模拟。采用所开发DP模型的MD模拟获得的氢原子自扩散系数，在广泛水合水平范围内比先前较小体系的从头算MD模拟结果更接近实验值。

摘要

原文标题：Adaptive Local Clustering over Attributed Graphs
中文标题：基于属性图的自适应局部聚类
发布日期：2025-03-26 12:24:07+00:00
作者：Haoran Zheng, Renchi Yang, Jianliang Xu
分类：cs.SI, cs.DS, cs.LG
原文链接：http://arxiv.org/abs/2503.20488v1

中文摘要：给定属性图$G$和种子节点$v_s$，局部图聚类(LGC)的目标是在与$C_s$大小近似线性相关的时间内，识别出围绕$v_s$的子图$C_s$（即局部簇）。这种方法无需访问整个图即可生成个性化簇，使其特别适用于涉及大规模图的应用场景。然而现有方案大多仅依赖图中节点的拓扑连接性，容易受到现实图中普遍存在的缺失链接或噪声链接的影响。为解决该问题，本文利用图拓扑与节点属性的互补特性来提升局部聚类质量。为有效挖掘属性信息，我们首先将LGC建模为双向扩散分布(BDD)的估计问题，该模型专门用于捕捉含属性节点的多跳关联性。进一步提出LACA方法——一种高效且具备强局部性的LGC解决方案，在多个真实数据集上表现出卓越性能。其核心组件包括：(i)基于理论基础的快速节点属性预处理技术；(ii)具有严格理论保证和加速收敛特性的自适应向量扩散算法；(iii)高效的BDD近似三步骤方案。通过在8个真实数据集上与17种对比方法的实验表明，LACA在真实局部簇标准下的结果质量优于所有对比方法，同时速度可提升数个数量级。代码已开源：https://github.com/HaoranZ99/alac。

摘要

原文标题：MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census
中文标题：MAnycast重装上阵：一个开放、快速、可靠且高效的日常任播普查工具
发布日期：2025-03-26 13:49:26+00:00
作者：Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij
分类：cs.NI
原文链接：http://arxiv.org/abs/2503.20554v1

中文摘要：IP任播是一种广泛采用的技术，通过将地址复制到多个位置来实现（例如）降低延迟和增强韧性。由于任播在现代互联网中的关键作用，先前研究已引入工具来执行任播普查。首个工具iGreedy利用地理分散位置的延迟测量来映射任播部署；第二个工具MAnycast2则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查，但存在准确性和精确度问题。相反，iGreedy精度极高但速度较慢，且探测成本更高。本文针对这两个系统的缺陷，提出了MAnycast Reloaded（MAnycastR）。我们以MAnycast2为基础，彻底重构其测量流水线，新增分布式探测支持、额外协议（UDP、TCP和IPv6）支持，以及类似iGreedy的延迟测量功能。通过在含32个全球分布式节点的任播测试床上验证，与外部任播生产部署对比，结合RIPE Atlas的广泛延迟测量，并对检测到的60%以上任播前缀进行运营商数据交叉核验，证明MAnycastR具备高准确性与精确度。我们将持续提供每日MAnycastR普查数据，并以宽松开源协议发布工具源代码。