查看“WikiEdge:ArXiv速递/2025-03-26”的源代码
←
WikiEdge:ArXiv速递/2025-03-26
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
== 摘要 == * '''原文标题''':Orbital optimization of large active spaces via AI-accelerators * '''中文标题''':基于AI加速器的大活性空间轨道优化 * '''发布日期''':2025-03-26 16:29:44+00:00 * '''作者''':Örs Legeza, Andor Menczer, Ádám Ganyecz, Miklós Antal Werner, Kornél Kapás, Jeff Hammond, Sotiris S. Xantheas, Martin Ganahl, Frank Neese * '''分类''':physics.chem-ph, cond-mat.str-el *'''原文链接''':http://arxiv.org/abs/2503.20700v1 '''中文摘要''':我们提出了一种高效的[[轨道优化]]方法,该方法将高度[[GPU加速]]的[[自旋适应]][[密度矩阵重整化群]]([[DMRG]])方法与[[ORCA]]程序包中实现的[[量子化学]][[完全活性空间自洽场]]([[CAS-SCF]])方法相结合。利用最新一代[[Nvidia GPU]]硬件的[[计算能力]],我们在包含数千个[[轨道]]中数百个[[电子]][[活性空间]]尺寸的[[分子体系]]中,实现了前所未有的[[CAS]]尺寸轨道优化——最高达82个电子和82个轨道[[CAS(82,82)]]。针对[[NVIDIA DGX-A100]]和[[DGX-H100]]硬件,我们对[[多环芳烃]]和不同尺寸[[铁硫复合物]]构成的[[基准体系]]进行了详细的[[DMRG-SCF]]方法[[缩放]]和[[误差分析]]。我们的研究首次证明,在[[大键维度]]下进行[[高精度]][[DMRG计算]]对获得可靠[[收敛]]的[[CAS-SCF能量]]至关重要。对于更具挑战性的[[铁硫]][[基准体系]],我们还发现收敛[[CAS-SCF计算]]的优化轨道对[[DMRG参数]]的[[敏感性]]高于[[多环芳烃]]体系。这种能在数天内获得如此大尺寸[[活性空间]]的收敛[[CAS-SCF能量]]和轨道的能力,降低了将适当轨道纳入[[CAS]]或选择正确最小[[CAS]]的挑战,可能为解决[[强关联]][[分子体系]]开辟全新途径。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重构动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成任何[[社会]]的[[结构性支柱]]。它们通过协调[[地球]]上几乎每一个[[个体]],形成了为所有人生产一切的[[社会新陈代谢系统]]。SCN绝非[[静态存在]],而是通过[[企业]]的进出和[[供应关系]]的[[重组]]持续[[演变]]。本研究利用独特[[数据集]]追踪了一个[[国家]]SCN中企业及其供需关系的[[时间演化]]。基于[[匈牙利]]2014至2022年按月申报的[[增值税]]数据,我们重建了包含711,248家企业和38,644,400条连接的[[整体经济网络]],以[[企业级分辨率]]捕捉了整个[[经济体]]的每次[[重构事件]]。研究发现:每年约25%的企业退出SCN,同时28%的新企业加入;平均55%的年度供应关系会在次年消失;供应关系的[[半衰期]]为13个月。新连接以[[超偏好依附]]方式链接企业,概率满足$p(i)\propto k_i^{1.08}$($k_i$表示企业$i$的连接数)。我们校准的简易[[统计网络生成模型]]成功复现了匈牙利主导SCN的[[典型特征]],不仅能重现[[入/出度分布]]、[[同配性]]和[[聚类结构]]等[[局部特征]],还能捕捉真实的[[系统性风险]]轮廓。该模型揭示了[[经济重连动态]]对量化[[系统韧性]]和估计[[冲击传导]]的关键作用。 == 摘要 == * '''原文标题''':The Scalar Size of the Pion from Lattice QCD * '''中文标题''':格点QCD中π介子的标量尺寸 * '''发布日期''':2025-03-26 16:20:11+00:00 * '''作者''':Konstantin Ottnad, Georg von Hippel * '''分类''':hep-lat, hep-ph *'''原文链接''':http://arxiv.org/abs/2503.20687v1 '''中文摘要''':我们提出了一种[[系统误差]]完全受控的[[格点QCD]]计算,用于确定[[π介子]][[标量形状因子]]及相关[[半径]]。计算结果基于17个[[规范系综]]的大规模数据集,这些系综采用$N_f=2+1$[[威尔逊Clover改进海夸克]]配置。这些系综覆盖了从$a=0.049\mathrm{fm}$到$a=0.086\mathrm{fm}$四种[[格点间距]]、$130-350\mathrm{MeV}$的[[π介子质量]]范围以及多种[[物理体积]]。通过对著名的[[夸克断开贡献]]的精确测定,我们首次在接近[[物理夸克质量]]的大尺寸精细系综上实现了形状因子前所未有的[[动量分辨率]]。研究采用了$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$范围内多种[[源汇间距]],可靠地提取了[[零动量转移]]和[[非零动量转移]]下的相关[[基态矩阵元]]。这使得我们能够首次通过所得形状因子$Q^2$依赖性的[[$z$展开]]参数化(而非小动量转移下的简单[[线性近似]])来获取标量半径。半径的[[物理外推]]采用三味[[NLO手征微扰理论]],以三个[[低能常数]](包括$L_4^r$的首个格点测定值)来参数化[[夸克质量依赖性]]。通过基于[[赤池信息准则]]的[[模型平均]]方法,我们系统评估了[[基态提取]]、形状因子参数化以及物理外推对最终结果的[[系统不确定性]]影响。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':基于属性图的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':摘要:给定[[图]]$G$和[[种子节点]]$v_s$,[[局部图聚类]](LGC)的目标是在与$C_s$大小近似线性相关的时间内,识别出围绕$v_s$的[[子图]]$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图]]的[[应用场景]]。然而,现有解决方案大多仅依赖图中节点的[[拓扑连接性]],容易受到现实图数据中普遍存在的[[缺失]]或[[噪声链接]]的影响。为解决这一问题,本文利用[[图拓扑]]与[[节点属性]]的互补特性来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将LGC建模为[[双向扩散分布]](BDD)的估计问题,该模型专门用于捕捉含属性节点的[[多跳关联性]]。进一步提出[[LACA]]方法——一种高效且具备严格[[理论保证]]的[[LGC]]解决方案,其核心包括:(i) 基于[[理论基础]]的快速[[节点属性预处理]]技术;(ii) 具有[[加速收敛]]特性的[[自适应向量扩散算法]];(iii) 高效的[[三步式BDD近似]]方案。通过在8个[[真实数据集]]上与17种方法的对比实验表明,LACA在[[真实局部簇]]的[[评估指标]]上全面优于现有方法,同时[[速度提升]]达[[数量级]]。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':High-Precision Ab Initio Radius Calculations of Boron Isotopes * '''中文标题''':硼同位素高精度从头算半径计算 * '''发布日期''':2025-03-26 17:50:28+00:00 * '''作者''':Tobias Wolfgruber, Tobias Gesser, Marco Knöll, Pieter Maris, Robert Roth * '''分类''':nucl-th *'''原文链接''':http://arxiv.org/abs/2503.20764v1 '''中文摘要''':我们采用[[手征有效场论]]中的多种现实相互作用对[[硼同位素]]半径进行了精确研究。通过[[从头算]]无核[[壳模型]]计算结合[[机器学习]]外推方法,我们获得了具有完整[[不确定性量化]]的半径预测值。进一步扩展到半径差异研究后,我们得以探究$^{8}$B中可能存在的[[质子晕]]现象,并提供了与[[同位素位移]]直接相关的预测值——该位移可通过实验进行精确测量。 == 摘要 == * '''原文标题''':Search for events with one displaced vertex from long-lived neutral particles decaying into hadronic jets in the ATLAS muon spectrometer in $pp$ collisions at $\sqrt{s}=13$ TeV * '''中文标题''':在$\sqrt{s}=13$ TeV质子-质子对撞中利用ATLASμ子谱仪寻找长寿命中性粒子衰变为强子喷注的单位移顶点事例 * '''发布日期''':2025-03-26 11:21:36+00:00 * '''作者''':ATLAS Collaboration * '''分类''':hep-ex *'''原文链接''':http://arxiv.org/abs/2503.20445v1 '''中文摘要''':摘要:本文报道了利用[[大型强子对撞机]][[ATLAS探测器]]在2015-2018年收集的140 fb$^{-1}$、质心能量$\sqrt{s}=13$ TeV的[[质子]]-[[质子]]对撞数据,对[[长寿命中性粒子]]衰变为[[强子喷注]]并在[[μ子谱仪]]中产生[[位移顶点]](距主相互作用顶点3-14米)的事件进行搜寻。观测到的事件数与预期本底一致,并对若干基准信号模型给出了限制。研究考虑了[[标量门户模型]]和[[希格斯玻色子]]门户[[重子生成模型]],并采用专用分析道针对[[Z玻色子]]伴随产生的[[长寿命粒子]](包括[[类轴子粒子]]和[[暗光子]]模型)进行探测。对于[[希格斯玻色子]]模型,在95%置信水平下排除了[[长寿命粒子]]固有衰变长度在5厘米至40米范围内、分支比高于1%的情况。对于所研究的[[避光类轴子粒子]]模型,本次搜寻对固有衰变长度大于$\mathcal{O}(10)$厘米的情况给出了迄今最强的限制。 == 摘要 == * '''原文标题''':Ion beam treatment of thick polystyrene films * '''中文标题''':厚聚苯乙烯薄膜的离子束处理 * '''发布日期''':2025-03-26 09:39:21+00:00 * '''作者''':Alexey Kondyurin * '''分类''':physics.chem-ph *'''原文链接''':http://arxiv.org/abs/2503.20359v1 '''中文摘要''':摘要:在[[硅片]]上旋涂厚度为78 nm至1.3 μm的[[聚苯乙烯]]薄膜经20 keV[[氮离子]]束处理后,[[椭圆偏振测量]]和[[FTIR光谱]]显示表面改性层与离子在[[聚合物]]中的[[穿透深度]](约70 nm)相符。然而,深层洗涤及后续测试表明,薄改性层中形成的[[自由基]]会迁移至体层,导致深层[[聚苯乙烯]]发生一系列[[化学结构]]变化。因此,尽管离子在[[聚苯乙烯]]膜中的[[穿透深度]]较浅,但整个薄膜的改性深度远超过[[离子投射范围]]。这表明[[离子束]]处理仅能条件性地视为[[表面改性]]方法,必须考虑[[自由基反应]]及其向[[聚合物]]深层迁移的可能性。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数极大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':我们研究一维[[高斯分布|高斯]][[位置混合模型]]的[[非参数统计|非参数]][[最大似然估计]]量$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定n个[[数据点]]时,该估计量总是返回最多含n个分量的[[混合模型]];而近期(Wu-Polyanskiy, 2020)对[[次高斯分布|次高斯]][[数据]]给出了严格的$O(\log n)$界。本文研究$\widehat{\pi}$的[[计算复杂性|计算特性]]:提出一种[[算法]],当$\varepsilon>0$足够小时,可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算[[Wasserstein距离]]下的$\varepsilon$[[近似解]],其中$K$与数据相关但与$\varepsilon$无关,$C$为[[绝对常数]],$k=|supp(\widehat{\pi})|\leq n$是$\widehat\pi$的[[原子测度|原子数]]。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$来自具有(相对于[[勒贝格测度]]的)[[概率密度函数|密度]]的[[概率分布]]时,这些保证几乎必然成立。我们还证明:当$k\leq \sqrt{n}/3$时,限定为k原子型的$\widehat\pi$[[条件分布]]在相关$2k-1$维[[参数空间]]上存在密度,且[[EM算法]]几乎必然具有[[收敛速度|局部线性收敛性]]。关键工具之一是[[非退化曲线]]的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子间势的聚合物电解质膜质子传输大规模长时原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习原子间势能]]([[MLIPs]])作为一种能够实现大规模、长时间[[原子模拟]]的方法备受关注,同时保持与基于[[密度泛函理论]]([[DFT]])和[[从头算波函数理论]]的[[电子结构计算]]相当的精度。然而,基于[[MLIP]]的[[分子动力学]]([[MD]])模拟面临的一个挑战是,与使用传统[[经典势能]]的模拟相比,其稳定性较低。分析高度异质系统或[[非晶材料]]通常需要大规模和长时间的模拟,因此需要开发能够实现稳定[[MD模拟]]的鲁棒性[[MLIPs]]。在本研究中,我们利用[[神经网络势能]]([[NNP]])生成器,构建了一个[[NNP模型]],该模型能够对[[全氟离子交换膜]]([[Nafion]])在不同[[水合水平]]下进行大规模、长时间的[[MD模拟]]。通过[[主动学习]]循环迭代扩展数据集,我们成功构建了一个鲁棒的[[深度势能]]([[DP]])模型。具体而言,通过将非平衡[[DPMD]]模拟采样的非平衡结构与结合最小原子间距离的[[三维结构特征空间]]中的结构筛选相结合,可以显著增强[[DP模型]]的鲁棒性,从而实现对约10,000至20,000个原子的大型[[Nafion系统]]进行长达31 ns的稳定[[MD模拟]]。采用所开发的[[DP模型]]进行的[[MD模拟]]得到的[[氢原子]]自[[扩散系数]],在广泛的[[水合水平]]范围内,与先前较小系统的[[从头算MD模拟]]相比,更接近[[实验值]]。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:开放、快速、可靠且高效的每日任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过将地址复制到多个位置来实现(例如降低[[延迟]]和增强[[韧性]])。由于[[任播]]在现代[[互联网]]中的关键作用,先前研究已开发了执行任播普查的工具。首个工具[[iGreedy]]利用地理分散位置的延迟测量来绘制任播部署图;第二个工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查,但存在[[准确性]]和[[精确性]]问题。相反,iGreedy精度极高但速度较慢,且探测成本更高。 本文针对这两个系统的缺陷,提出了[[MAnycast Reloaded]](MAnycastR)。我们以MAnycast2为基础,彻底重构其测量流水线,新增[[分布式探测]]支持、额外[[协议]]([[UDP]]、[[TCP]]和[[IPv6]])支持,以及类似iGreedy的延迟测量功能。通过在含32个全球分布式节点的任播测试平台验证,与真实任播生产部署对比,并利用[[RIPE Atlas]]进行大规模延迟测量,同时对照[[运营商]]提供的真实数据交叉核验超过60%的检测任播前缀,证明MAnycastR具备高准确性和精确性。我们将持续提供每日MAnycastR普查数据,并以宽松[[开源协议]]发布工具[[源代码]]。 == 摘要 == * '''原文标题''':Scalability Evaluation of HPC Multi-GPU Training for ECG-based LLMs * '''中文标题''':基于心电图的大语言模型多GPU训练的可扩展性评估 * '''发布日期''':2025-03-26 22:48:17+00:00 * '''作者''':Dimitar Mileski, Nikola Petrovski, Marjan Gusev * '''分类''':cs.DC, C.4; I.6 *'''原文链接''':http://arxiv.org/abs/2503.21033v1 '''中文摘要''':摘要:训练大型[[语言模型]]需要大量[[计算处理]],这依赖于众多[[高性能计算]]资源。本研究比较了[[多节点]]与[[多GPU]]环境在[[心电图]]大型语言模型训练中的表现。详细梳理了当前[[分布式深度学习]]框架在多节点和多GPU配置下的应用方案,包括[[Uber]]的[[Horovod]]、[[微软]]的[[DeepSpeed]],以及[[PyTorch]]和[[TensorFlow]]的内置分布式功能。针对不同[[数据集]]配置,我们对比了多种多GPU方案,独立利用多个[[HPC节点]],重点关注[[可扩展性]]、[[加速比]]、[[效率]]和[[开销]]。分析采用配备[[SLURM]]调度系统、[[Apptainer]]([[Singularity]])容器、[[CUDA]]、PyTorch和[[Shell脚本]]的[[HPC基础设施]]来支持训练流程自动化。实验结果显示GPU数量扩展时获得[[次线性加速比]],双GPU达1.6倍,四GPU达1.9倍。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重构动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成了任何社会的结构性支柱。它们通过协调地球上几乎每一个个体,形成了为所有人生产一切的社会[[新陈代谢系统]]。供应链网络绝非静态存在,而是通过企业的进入退出与供应关系的重组持续演变。本文利用独特数据集研究了一个国家供应链网络中企业及其供应商-采购商关系的时序演化。基于[[匈牙利]]2014至2022年按月申报的[[增值税]]数据,我们重建了包含711,248家企业和38,644,400条连接的整体[[经济网络]],以企业级分辨率捕捉了整个经济体几乎所有的重构事件。研究发现:每年约25%的企业退出供应链网络,同时28%的新企业进入;平均而言,当年存在的供应链接中有55%会在次年消失;供应链接的[[半衰期]]为13个月。新链接以超偏好依附概率$p(i)\propto k_i^{1.08}$($k_i$表示企业$i$的供应连接数)附着于企业。我们校准了一个能复现匈牙利主导供应链网络典型特征的简易统计[[网络生成模型]],该模型不仅再现了入/出度分布、[[同配性]]和[[聚类结构]]等局部网络特征,还捕捉到真实的[[系统性风险]]特征。最后探讨了[[经济重连]]动态对量化[[系统韧性]]和估计[[冲击传导]]的关键作用。 == 摘要 == * '''原文标题''':The Scalar Size of the Pion from Lattice QCD * '''中文标题''':格点QCD计算的π介子标量尺寸 * '''发布日期''':2025-03-26 16:20:11+00:00 * '''作者''':Konstantin Ottnad, Georg von Hippel * '''分类''':hep-lat, hep-ph *'''原文链接''':http://arxiv.org/abs/2503.20687v1 '''中文摘要''':我们提出了一种系统误差完全受控的[[格点QCD]]计算,用于确定[[π介子]]标量形状因子及相关半径。计算结果基于17个[[规范场]]组态的大规模集合,采用$N_f=2+1$[[威尔逊-克拉沃尔改进海夸克]]。这些组态覆盖了从$a=0.049\mathrm{fm}$到$a=0.086\mathrm{fm}$四种[[格距]]、$130-350\mathrm{MeV}$的[[π介子质量]]范围以及多种[[物理体积]]。通过精确计算著名的[[夸克断开贡献]],我们在接近[[物理夸克质量]]的大尺寸精细组态上,实现了[[形状因子]]前所未有的[[动量分辨率]]。采用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$的大范围[[源汇间距]],可靠地提取了[[零动量转移]]和[[非零动量转移]]下的相关[[基态矩阵元]]。这使得我们首次能够通过所得[[形状因子]]$Q^2$依赖性的[[$z$展开]]参数化(而非小动量转移下的简单[[线性近似]])来获取[[标量半径]]。使用三味[[NLO手征微扰理论]]对半径进行[[物理外推]],通过三个[[低能常数]](包括$L_4^r$的首次[[格点测定]])参数化[[夸克质量]]依赖性。基于[[赤池信息准则]]的[[模型平均]]方法,我们系统评估了[[基态提取]]、[[形状因子]]参数化以及[[物理外推]]对最终结果的[[系统不确定性]]。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':基于属性图的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':给定[[图]]$G$和种子节点$v_s$,[[局部图聚类]](LGC)的目标是在与$C_s$大小大致成线性关系的时间内,识别出围绕$v_s$的子图$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图]]的应用场景。然而,现有解决方案大多仅依赖图中节点的[[拓扑连接]]关系,容易受到现实图数据中普遍存在的[[缺失链接]]或[[噪声链接]]的影响。 为解决这一问题,本文利用[[图拓扑]]与[[节点属性]]的互补特性来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将LGC问题建模为[[双向扩散分布]](BDD)的估计问题,该模型专门用于捕捉带属性节点的[[多跳关联性]]。进一步提出[[LACA]]方法——一种高效且具备严格[[理论保证]]的LGC解决方案,其核心组件包括:(i)快速且理论完备的[[节点属性预处理]]技术;(ii)具有理论保证和加速收敛特性的[[自适应向量扩散算法]];(iii)有效的BDD近似[[三步骤方案]]。通过在8个[[真实数据集]]上与17种[[对比方法]]的实验表明,LACA在真实[[局部簇]]的评估指标上全面优于所有对比方法,同时速度提升达数量级。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':Orbital optimization of large active spaces via AI-accelerators * '''中文标题''':基于AI加速器的大活性空间轨道优化 * '''发布日期''':2025-03-26 16:29:44+00:00 * '''作者''':Örs Legeza, Andor Menczer, Ádám Ganyecz, Miklós Antal Werner, Kornél Kapás, Jeff Hammond, Sotiris S. Xantheas, Martin Ganahl, Frank Neese * '''分类''':physics.chem-ph, cond-mat.str-el *'''原文链接''':http://arxiv.org/abs/2503.20700v1 '''中文摘要''':我们提出了一种高效的[[轨道优化]]方法,该方法将高度[[GPU加速]]的[[自旋适应]][[密度矩阵重整化群]]([[DMRG]])方法与[[ORCA]]程序包中实现的[[量子化学]][[完全活性空间自洽场]]([[CAS-SCF]])方法相结合。利用最新一代[[Nvidia GPU]]硬件的[[计算能力]],我们在包含数千个轨道中数百个电子[[活性空间]]尺寸的[[分子体系]]中,实现了前所未有的[[CAS]]尺寸轨道优化——高达82个电子和82个轨道[[CAS(82,82)]]。针对[[NVIDIA DGX-A100]]和[[DGX-H100]]硬件,我们对[[多环芳烃]]和不同尺寸[[铁硫配合物]][[基准体系]]进行了详细的[[DMRG-SCF]]方法[[扩展性]]和[[误差分析]]。我们的研究首次证明,在[[大键维度]]下进行[[高精度]][[DMRG计算]]对获得可靠收敛的[[CAS-SCF能量]]至关重要。对于更具挑战性的[[铁硫]][[基准体系]],我们还发现收敛[[CAS-SCF计算]]的[[优化轨道]]对[[DMRG参数]]的[[敏感性]]高于[[多环芳烃]]体系。这种能在数天内获得如此大尺寸[[活性空间]]的收敛[[CAS-SCF能量]]和轨道的能力,降低了将适当轨道纳入[[CAS]]或选择正确最小[[CAS]]的挑战,可能为处理[[强关联]][[分子体系]]开辟全新途径。 == 摘要 == * '''原文标题''':Ion beam treatment of thick polystyrene films * '''中文标题''':厚聚苯乙烯薄膜的离子束处理 * '''发布日期''':2025-03-26 09:39:21+00:00 * '''作者''':Alexey Kondyurin * '''分类''':physics.chem-ph *'''原文链接''':http://arxiv.org/abs/2503.20359v1 '''中文摘要''':摘要:在[[硅片]]上旋涂厚度从78[[纳米]]至1.3[[微米]]不等的[[聚苯乙烯]][[薄膜]],经20 keV[[氮]][[离子束]]处理后,[[椭偏仪]]测量和[[傅里叶变换红外光谱]]显示表面改性层与离子在[[聚合物]]中的[[穿透深度]](约70纳米)相符。然而,深层洗涤及后续测试表明,薄改性层中形成的[[自由基]]会迁移至[[本体层]],导致深层[[聚苯乙烯]][[化学结构]]发生系列变化。因此,尽管离子在[[聚苯乙烯]][[膜]]中的穿透深度有限,整个薄膜的[[改性深度]]却远超过[[离子]][[投影射程]]。这表明[[离子束]][[处理]]仅能条件性地视为[[表面改性]]方法,必须考虑[[自由基]][[反应]]及其向[[聚合物]]深层迁移的可能性。 == 摘要 == * '''原文标题''':Dynamic-OCT simulation framework based on mathematical models of intratissue dynamics, image formation, and measurement noise * '''中文标题''':基于组织内动态、成像形成和测量噪声数学模型的动态OCT仿真框架 * '''发布日期''':2025-03-26 10:31:16+00:00 * '''作者''':Yuanke Feng, Shumpei Fujimura, Yiheng Lim, Thitiya Seesan, Rion Morishita, Ibrahim Abd El-Sadek, Pradipta Mukherjee, Shuichi Makita, Yoshiaki Yasuno * '''分类''':physics.med-ph, physics.optics *'''原文链接''':http://arxiv.org/abs/2503.20407v1 '''中文摘要''':[[动态光学相干断层扫描]](DOCT)通过捕捉由[[细胞]]内和[[组织]]内运动引起的[[时间]][[OCT信号]]变化,实现了无标记[[功能成像]]。然而,DOCT信号与其背后样本运动之间的关系仍不明确。本文提出一个综合DOCT[[仿真框架]],该框架整合了[[细胞内]]/[[组织内]]运动的[[数学模型]]、两种从[[运动散射体]]模型生成[[OCT信号]]时间序列的[[OCT信号发生器]]类型,以及代表性[[DOCT算法]]。详细描述了该框架的[[理论]]与[[算法]],并通过[[数值研究]]验证了其实用性。该框架已开源,将增进对DOCT的[[理解]]和[[应用价值]]。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数最大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':我们研究一维[[高斯分布|高斯]][[位置混合模型]]的[[非参数统计|非参数]][[最大似然估计]]量$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定n个[[数据点]]时,该估计量始终返回最多含n个[[混合模型]]的[[分量]];而近期(Wu-Polyanskiy, 2020)对[[次高斯分布|次高斯]][[数据]]给出了严格的$O(\log n)$界。本文研究$\widehat{\pi}$的[[计算复杂性|计算特性]]:针对足够小的$\varepsilon>0$,我们提出[[算法]]可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算[[Wasserstein距离]]下的$\varepsilon$[[近似解]],其中$K$依赖数据但独立于$\varepsilon$,$C$为[[绝对常数]],$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的[[原子数量]]。我们还可在有限时间内[[确定性算法|确定性]]计算$|supp(\widehat\pi)|$的[[精确值]]。当[[数据集]]$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$来自具有[[Lebesgue测度]][[概率密度函数|密度]]的[[独立分布]]时,这些保证几乎必然成立。同时证明:当$k\leq \sqrt{n}/3$时,限定为k原子结构的$\widehat\pi$[[条件分布]]在相应$2k-1$维[[参数空间]]上存在密度,且[[EM算法]]几乎必然具有[[局部收敛性|局部线性收敛性]]。关键工具之一是[[非退化曲线]]的经典[[傅里叶分析]][[估计理论|估计]]。 == 摘要 == * '''原文标题''':Search for events with one displaced vertex from long-lived neutral particles decaying into hadronic jets in the ATLAS muon spectrometer in $pp$ collisions at $\sqrt{s}=13$ TeV * '''中文标题''':在$\sqrt{s}=13$ TeV的$pp$对撞中ATLASμ子谱仪内长寿命中性粒子衰变为强子喷注产生单位移顶点的事例搜寻 * '''发布日期''':2025-03-26 11:21:36+00:00 * '''作者''':ATLAS Collaboration * '''分类''':hep-ex *'''原文链接''':http://arxiv.org/abs/2503.20445v1 '''中文摘要''':摘要:本文报道了利用[[ATLAS探测器]]在[[大型强子对撞机]]上收集的数据(2015-2018年记录的140 fb$^{-1}$、$\sqrt{s} = 13$ TeV[[质子]]-[[质子]]对撞数据)对长寿命[[中性粒子]]衰变为[[强子]][[喷注]]产生单位移[[顶点]]事件的搜寻。该研究采用[[顶点重建]]技术,针对[[μ子]][[谱仪]]中距主相互作用顶点3米至14米处衰变的[[长寿命粒子]]。观测事件数与预期本底相符,并确定了若干基准[[信号模型]]的限制。研究考虑了[[标量]][[门户模型]]和[[希格斯玻色子]][[门户]][[重子生成]]模型,同时设立专用分析通道针对[[Z玻色子]]伴随的长寿命粒子产生过程(包括[[类轴子粒子]]和[[暗光子]]模型)。对于[[希格斯玻色子]]模型,在95%[[置信水平]]下排除了长寿命粒子固有[[衰变长度]]5厘米至40米范围内[[分支比]]高于1%的情况。对于所研究的[[避光]][[类轴子粒子]]模型,本次搜寻对固有衰变长度大于$\mathcal{O}(10)$厘米的情况给出了迄今最强的限制。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习原子间势]]([[MLIPs]])作为一种能够实现大规模、长时间[[原子尺度模拟]]的方法,同时保持与基于[[密度泛函理论]]([[DFT]])和[[从头算波函数理论]]的[[电子结构计算]]相当的精度,引起了广泛关注。然而,基于[[MLIP]]的[[分子动力学]]([[MD]])模拟面临的挑战是其稳定性低于使用传统[[经典势]]的模拟。分析高度异质体系或[[非晶材料]]通常需要大规模和长时间的模拟,因此需要开发能够实现稳定[[MD模拟]]的鲁棒[[MLIP]]。在本研究中,我们利用[[神经网络势]]([[NNP]])生成器,构建了一个[[NNP模型]],能够在广泛[[水合水平]]范围内对[[全氟离聚物膜]]([[Nafion]])进行大规模、长时间的[[MD模拟]]。通过[[主动学习]]循环迭代扩展数据集,我们成功建立了鲁棒的[[深度势]]([[DP]])模型。具体而言,通过将非平衡[[DPMD]]模拟采样的非平衡结构与结合最小原子间距的[[三维结构特征空间]]中的结构筛选相结合,可以显著增强[[DP模型]]的鲁棒性,从而实现对约10,000至20,000个原子的大型[[Nafion体系]]进行长达31 ns的稳定[[MD模拟]]。采用所开发[[DP模型]]的[[MD模拟]]获得的[[氢原子]]自[[扩散系数]],在广泛[[水合水平]]范围内与实验值更为接近,优于先前对小体系进行的[[从头算MD模拟]]结果。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:一个开放、快速、可靠且高效的每日任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过在多位置复制地址来实现降低[[延迟]]和增强[[韧性]]等目标。鉴于[[任播]]在现代[[互联网]]中的关键作用,先前研究已开发了执行任播普查的工具。首个工具[[iGreedy]]利用地理分散节点的延迟测量来绘制任播部署图;第二个工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查,但存在[[准确性]]和[[精确性]]问题。相反,iGreedy精度极高但速度较慢,且探测成本更高。 本文针对这两个系统的缺陷提出了[[MAnycast Reloaded]](MAnycastR)。以MAnycast2为基础,我们彻底重构了其测量流水线,新增[[分布式探测]]支持、额外[[协议]]([[UDP]]、[[TCP]]和[[IPv6]])支持,以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR,与外部任播生产部署进行对比,通过[[RIPE Atlas]]进行广泛延迟测量,并对检测到的60%以上任播前缀进行[[运营商]]数据交叉核验。结果表明MAnycastR实现了高准确性与精确度。我们将持续提供每日MAnycastR普查数据,并以宽松[[开源协议]]发布工具[[源代码]]。 == 摘要 == * '''原文标题''':High-Performance Computational Magnetohydrodynamics with Python * '''中文标题''':基于Python的高性能磁流体力学计算 * '''发布日期''':2025-03-26 18:16:17+00:00 * '''作者''':Chris Bard, John Dorelli * '''分类''':physics.plasm-ph, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20899v1 '''中文摘要''':我们推出[[AGATE]]模拟代码,这是一个基于[[Python]]开发的框架,主要用于求解[[磁流体动力学]]([[MHD]])方程,同时保持对其他方程组的适应性。该代码采用[[模块化]]、[[面向对象]]的架构,将[[接口规范]]与[[数值实现]]分离,允许用户自定义[[数值方法]]和[[物理模型]]。基于[[Godunov]]型[[有限体积]]格式构建的[[AGATE]]目前支持[[理想]]、[[霍尔]]及[[Chew-Goldberger-Low]]([[CGL]])三种[[MHD]]方程,并提供从[[Numpy]]到支持[[NVIDIA CUDA]]的[[GPU计算]]等多种加速选项。性能测试表明我们的[[GPU]]实现相比[[CPU]]版本可获得40-60倍的加速。通过标准[[基准测试]]的全面验证,证实了该代码能准确再现不同[[MHD]]体系下的[[线性]]和[[非线性]]现象。这种兼具[[模块化]]、[[高性能]]和[[可扩展性]]的特点,使得[[AGATE]]适用于从快速[[原型开发]]到[[生产模拟]]、从[[数值算法]]开发到[[物理教学]]等多种应用场景。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重连动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成了任何社会的结构性支柱。它们通过协调地球上几乎每一个个体,形成了为所有人生产一切的社会[[新陈代谢系统]]。SCN绝非静态存在,而是通过[[企业]]的进出与[[供应关系]]的重组持续演变。本研究利用独特[[数据集]]追踪了一个国家供应链网络中企业及其供需关系的时序演化。基于[[匈牙利]]2014至2022年按月申报的[[增值税]]数据,我们重建了包含711,248家企业和38,644,400条连接的整体[[经济网络]],实现了企业级分辨率下完整[[经济体系]]重组事件的全面覆盖。研究发现:每年约25%的企业退出SCN,同时28%的新企业加入;平均55%的年度供应关系会在次年消失;供应关系的[[半衰期]]为13个月。新连接以[[超偏好依附]]方式链接企业,概率满足$p(i)\propto k_i^{1.08}$($k_i$表示企业i的供应连接数)。我们校准的简易[[统计网络]]生成模型成功复现了匈牙利主导SCN的典型特征,不仅匹配[[入/出度分布]]、[[同配性]]和[[聚类结构]]等局部特征,还能捕捉真实的[[系统性风险]]轮廓。该模型揭示了[[经济网络]]重连动态对量化[[系统韧性]]和评估[[冲击传导]]的关键作用。 == 摘要 == * '''原文标题''':The Scalar Size of the Pion from Lattice QCD * '''中文标题''':格点QCD中π介子的标量大小 * '''发布日期''':2025-03-26 16:20:11+00:00 * '''作者''':Konstantin Ottnad, Georg von Hippel * '''分类''':hep-lat, hep-ph *'''原文链接''':http://arxiv.org/abs/2503.20687v1 '''中文摘要''':我们提出了一种[[系统误差]]完全受控的[[格点QCD]]计算,用于确定[[π介子]][[标量形状因子]]及相关[[半径]]。计算结果基于17个[[规范场]][[组态]]的大规模集合,采用$N_f=2+1$[[威尔逊-克拉沃尔改进海夸克]]。这些组态覆盖了从$a=0.049\mathrm{fm}$到$a=0.086\mathrm{fm}$四种[[格距]]、$130-350\mathrm{MeV}$的[[π介子质量]]范围以及多种[[物理体积]]。通过对著名的[[夸克断开贡献]]的精确测定,我们首次在接近[[物理夸克质量]]的大尺寸精细组态上实现了[[形状因子]]前所未有的[[动量分辨率]]。采用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$的大范围[[源汇间距]],可靠地提取了[[零动量转移]]和[[非零动量转移]]下的相关[[基态矩阵元]]。这使得我们首次能够通过所得[[形状因子]]$Q^2$依赖性的$z$[[展开参数化]](而非小动量转移下的简单[[线性近似]])来获取[[标量半径]]。半径的[[物理外推]]采用三味[[NLO手征微扰理论]],以三个[[低能常数]](包括$L_4^r$的首次[[格点测定]]结果)参数化[[夸克质量依赖性]]。通过基于[[赤池信息准则]]的[[模型平均]]方法,系统评估了[[基态提取]]、[[形状因子]]参数化以及[[物理外推]]对最终结果的[[系统不确定性]]影响。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':基于属性图的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':给定[[图]]$G$和[[种子节点]]$v_s$,[[局部图聚类]](LGC)的目标是在与$C_s$大小大致成线性关系的时间内,识别出围绕$v_s$的[[子图]]$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图]]的[[应用场景]]。然而现有方案大多仅依赖图中节点的[[拓扑连接性]],容易受到现实图数据中普遍存在的[[缺失]]或[[噪声链接]]的影响。 为解决该问题,本文利用[[图拓扑]]与[[节点属性]]的互补特性来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将LGC建模为[[双向扩散分布]](BDD)的估计问题,该模型专门用于捕捉含属性节点的[[多跳关联性]]。进一步提出[[LACA]]方法——一种高效且具备强[[局部性]]的LGC解决方案,在多个[[真实数据集]]上表现出卓越性能。其核心组件包括:(i) 基于[[理论基础]]的快速[[节点属性预处理]]技术;(ii) 具有严格[[理论保证]]和[[加速收敛]]特性的[[自适应向量扩散算法]];(iii) 高效的[[三步式BDD近似]]方案。通过在8个[[真实数据集]]上与17种[[对比方法]]的实验表明,LACA在[[真实局部簇标准]]下的结果质量优于所有对比方法,同时速度可提升数个[[数量级]]。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':Scalability Evaluation of HPC Multi-GPU Training for ECG-based LLMs * '''中文标题''':基于心电图的大语言模型多GPU训练的可扩展性评估 * '''发布日期''':2025-03-26 22:48:17+00:00 * '''作者''':Dimitar Mileski, Nikola Petrovski, Marjan Gusev * '''分类''':cs.DC, C.4; I.6 *'''原文链接''':http://arxiv.org/abs/2503.21033v1 '''中文摘要''':摘要:训练大型[[语言模型]]需要大量[[计算处理]],这得益于众多[[高性能计算]]资源的支持。本研究比较了[[多节点]]与[[多GPU]]环境在[[心电图]]大型语言模型训练中的表现。详细梳理了当前[[分布式深度学习]]框架在多节点和多GPU配置下的应用方案,包括[[Uber]]的[[Horovod]]、[[微软]]的[[DeepSpeed]]以及[[PyTorch]]和[[TensorFlow]]的内置分布式功能。针对不同[[数据集]]配置,我们对比了多种多GPU方案,独立利用多个[[HPC节点]],重点关注[[可扩展性]]、[[加速比]]、[[效率]]和[[开销]]。分析过程采用配备[[SLURM]]调度系统、[[Apptainer]]([[Singularity]])容器、[[CUDA]]、[[PyTorch]]和[[shell脚本]]的[[HPC基础设施]]来支持[[训练工作流]]和[[自动化]]。实验结果显示[[GPU]]数量扩展时获得[[次线性加速比]],双GPU达1.6倍,四GPU达1.9倍。 == 摘要 == * '''原文标题''':Ion beam treatment of thick polystyrene films * '''中文标题''':厚聚苯乙烯薄膜的离子束处理 * '''发布日期''':2025-03-26 09:39:21+00:00 * '''作者''':Alexey Kondyurin * '''分类''':physics.chem-ph *'''原文链接''':http://arxiv.org/abs/2503.20359v1 '''中文摘要''':在[[硅片]]上旋涂厚度从78[[纳米]]至1.3[[微米]]不等的[[聚苯乙烯]]薄膜,经20 [[keV]][[氮]][[离子束]]处理后,[[椭偏仪]]测量和[[傅里叶变换红外光谱]]显示表面改性层深度与离子在[[聚合物]]中的穿透深度(约70纳米)相符。然而,深层洗涤及后续测试表明:薄改性层中形成的[[自由基]]会迁移至体层,导致聚苯乙烯深层[[化学结构]]发生系列变化。因此,尽管离子在聚苯乙烯膜中的穿透深度较浅,但整个薄膜的改性深度远超[[离子投影射程]]。这表明离子束处理仅能条件性地视为[[表面改性]]方法,必须考虑自由基反应及其向聚合物深层迁移的可能性。 == 摘要 == * '''原文标题''':Orbital optimization of large active spaces via AI-accelerators * '''中文标题''':基于AI加速器的大活性空间轨道优化 * '''发布日期''':2025-03-26 16:29:44+00:00 * '''作者''':Örs Legeza, Andor Menczer, Ádám Ganyecz, Miklós Antal Werner, Kornél Kapás, Jeff Hammond, Sotiris S. Xantheas, Martin Ganahl, Frank Neese * '''分类''':physics.chem-ph, cond-mat.str-el *'''原文链接''':http://arxiv.org/abs/2503.20700v1 '''中文摘要''':我们提出了一种高效的[[轨道优化]]方法,该方法将高度[[GPU加速]]的[[自旋适应]][[密度矩阵重整化群]]([[DMRG]])方法与[[ORCA]]程序包中实现的[[量子化学]][[完全活性空间自洽场]]([[CAS-SCF]])方法相结合。利用最新一代[[Nvidia GPU]]硬件的[[计算能力]],我们在包含数千个轨道中数百个电子[[活性空间]]尺寸的[[分子体系]]中,实现了前所未有的[[CAS]]尺寸轨道优化——最高达82个电子和82个轨道[[CAS(82,82)]]。针对[[NVIDIA DGX-A100]]和[[DGX-H100]]硬件,我们对[[多环芳烃]]和不同尺寸[[铁硫复合物]]构成的基准体系进行了详细的[[DMRG-SCF]]方法[[缩放]]和[[误差分析]]。我们的研究首次证明,在[[大键维度]]下进行[[高精度]][[DMRG计算]]对于获得可靠收敛的[[CAS-SCF能量]]至关重要。对于更具挑战性的[[铁硫]]基准体系,我们还发现收敛[[CAS-SCF计算]]的优化轨道对[[DMRG参数]]的敏感性高于[[多环芳烃]]体系。这种能在数天内获得如此大尺寸活性空间的收敛[[CAS-SCF能量]]和轨道的能力,降低了将适当轨道纳入[[CAS]]或选择正确最小[[CAS]]的挑战,可能为处理[[强关联]][[分子体系]]开辟全新途径。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数极大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':我们研究一维[[高斯分布|高斯]][[位置混合模型]]的[[非参数统计|非参数]][[极大似然估计]]量$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定n个[[数据点]]时,该估计量总是返回最多含n个分量的混合模型;而近期(Wu-Polyanskiy, 2020)对[[次高斯分布|次高斯]]数据给出了精确的$O(\log n)$界。本文研究$\widehat{\pi}$的计算特性:我们提出一种[[算法]],当$\varepsilon>0$足够小时,可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算得到$\widehat\pi$的[[Wasserstein距离]]$\varepsilon$-近似解。其中$K$与数据相关但独立于$\varepsilon$,$C$为绝对常数,$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的[[原子(测度论)|原子]]数量。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$中的点独立采样自具有[[Lebesgue测度]]密度的[[概率分布]]时,这些保证几乎必然成立。我们还证明:当$\widehat\pi$被约束为k原子分布时,其在$2k-1$维[[参数空间]]上存在密度(对所有$k\leq \sqrt{n}/3$成立),且[[EM算法]]几乎必然具有局部[[线性收敛]]性。关键工具之一是对[[非退化曲线]]的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子间势的聚合物电解质膜质子传输大规模长时原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习原子间势]]([[MLIPs]])作为一种能够实现大规模、长时间[[原子尺度模拟]]的方法备受关注,同时保持与基于[[密度泛函理论]]([[DFT]])和[[从头算波函数理论]]的[[电子结构计算]]相当的精度。然而,基于[[MLIP]]的[[分子动力学]]([[MD]])模拟面临的一个挑战是,与传统[[经典势函数]]相比其[[稳定性]]较低。分析高度[[异质体系]]或[[非晶材料]]通常需要大规模和长时间的模拟,因此需要开发能够实现稳定[[MD模拟]]的[[鲁棒性]][[MLIPs]]。在本研究中,我们利用自研的[[神经网络势]]([[NNP]])生成器,构建了一个[[NNP模型]],能够对[[全氟离聚物膜]]([[Nafion]])在不同[[水合水平]]下进行大规模、长时间的[[MD模拟]]。通过[[主动学习]]循环迭代扩展[[数据集]],我们成功建立了[[鲁棒]]的[[深度势]]([[DP]])模型。具体而言,通过将[[非平衡]][[DPMD模拟]]采样的[[非平衡结构]]与结合[[最小原子间距]]的[[三维结构特征空间]]中的[[结构筛选]]相结合,可显著提升[[DP模型]]的[[鲁棒性]],从而实现对约10,000至20,000个[[原子]]的大型[[Nafion体系]]进行长达31 [[ns]]的稳定[[MD模拟]]。采用所开发[[DP模型]]的[[MD模拟]]获得的[[氢原子]][[自扩散系数]],在广泛[[水合水平]]范围内比先前小体系[[从头算]][[MD模拟]]结果更接近[[实验值]]。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:开放、快速、可靠且高效的每日任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过在多位置复制地址来实现降低[[延迟]]、增强[[韧性]]等目标。鉴于[[任播]]在现代[[互联网]]中的关键作用,先前研究已开发了多种任播普查工具。首款工具[[iGreedy]]通过地理分散的延迟测量来绘制任播部署图;第二款工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——仅需3小时即可完成全网普查,但存在[[准确性]]和[[精确度]]问题。反之,iGreedy精度极高但速度较慢,且探测成本更高。 本文针对这两个系统的缺陷,提出了升级版[[MAnycast Reloaded]](MAnycastR)。以MAnycast2为基础,我们彻底重构了其测量管道,新增[[分布式探测]]支持、额外[[协议]]([[UDP]]、[[TCP]]和[[IPv6]])支持以及类似iGreedy的延迟测量功能。通过在含32个全球分布式节点的任播测试床上验证,与真实任播生产部署对比,并利用[[RIPE Atlas]]进行大规模延迟测量,同时对照[[运营商]]提供的真实数据核验了60%以上检测到的任播前缀,证明MAnycastR具备高准确性与精确度。我们将持续提供每日更新的MAnycastR普查数据,并以宽松[[开源协议]]发布工具[[源代码]]。 == 摘要 == * '''原文标题''':Flow of a two-dimensional liquid foam: Impact of surfactant type and boundary conditions * '''中文标题''':二维液体泡沫的流动:表面活性剂类型和边界条件的影响 * '''发布日期''':2025-03-26 16:44:40+00:00 * '''作者''':Farshad Nazari, Andrei Potanin, Hadi Mohammadigoushki * '''分类''':cond-mat.soft, physics.flu-dyn *'''原文链接''':http://arxiv.org/abs/2503.20710v1 '''中文摘要''':本研究通过实验探究了[[二维]]单分散[[水基泡沫]]在平行板间剪切时的[[流变]]与[[流动行为]],采用自制[[光流变仪]](配备光滑/粗糙壁面)进行测试。使用两种市售[[洗涤剂]](Foam 1和Foam 2)制备泡沫,保持[[气泡尺寸]]和[[液相分数]]一致。线性[[粘弹性]]结果表明:无论[[边界条件]]如何,Foam 1始终表现出比Foam 2更高的[[弹性模量]]和[[损耗模量]],且粗糙壁面会进一步强化两种泡沫的模量。此外,Foam 1的粘弹性[[弛豫频率]]较低,表明其[[界面流动性]]较弱。在非线性区域观察到显著差异:光滑边界条件下,Foam 2呈现[[屈服应力]]特性而Foam 1未出现,尽管后者具有更高的[[粘性应力]]。Foam 1的粘性应力与[[毛细数]]呈标度关系,而Foam 2的标度行为依边界条件(光滑/粗糙壁面)呈现差异。这些流变行为差异源于[[表面活性剂]]化学性质不同导致的界面流动性差异,其中Foam 1的界面流动性低于Foam 2。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重连动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成任何[[社会]]的[[结构性支柱]]。它们通过协调[[地球]]上几乎每一个[[个体]],形成了为所有人生产一切的[[社会新陈代谢系统]]。SCN绝非[[静态存在]],而是通过[[企业]]的进出与[[供应关系]]的[[重组]]持续[[演变]]。本文利用独特[[数据集]]研究了一个[[国家]]SCN中企业及其[[供应商]]-[[客户关系]]的[[时间演化]]。基于[[匈牙利]]2014至2022年每月报告的[[增值税]]数据,我们重建了包含711,248家企业和38,644,400条连接的完整[[经济网络]],以[[企业级分辨率]]覆盖了整个[[经济体]]的几乎所有[[重构事件]]。研究发现:每年约25%的企业退出SCN,同时28%的[[新企业]]加入;平均55%的现存[[供应链接]]会在次年消失;供应链接的[[半衰期]]为13个月。新链接以[[超偏好依附]]方式连接企业,概率满足$p(i)\propto k_i^{1.08}$($k_i$表示企业$i$的[[供应连接数]])。我们校准了一个能复现匈牙利主导SCN典型特征的简单[[统计网络生成模型]],该模型不仅再现了[[入/出度分布]]、[[同配性]]和[[聚类结构]]等[[局部网络特征]],还捕捉了真实的[[系统性风险]]轮廓。最后讨论了当前模型如何通过[[经济重连动态]]来量化[[系统韧性]]及评估[[冲击传导]]。 == 摘要 == * '''原文标题''':The Scalar Size of the Pion from Lattice QCD * '''中文标题''':π介子标量尺寸的格点QCD研究 * '''发布日期''':2025-03-26 16:20:11+00:00 * '''作者''':Konstantin Ottnad, Georg von Hippel * '''分类''':hep-lat, hep-ph *'''原文链接''':http://arxiv.org/abs/2503.20687v1 '''中文摘要''':我们提出了一种[[系统误差]]完全受控的[[格点QCD]]计算,用于确定[[π介子]]标量[[形状因子]]及相关[[半径]]。计算结果基于17个[[规范系综]]的大规模数据集,这些系综采用$N_f=2+1$[[威尔逊Clover改进海夸克]]配置,涵盖$0.049\mathrm{fm}$至$0.086\mathrm{fm}$四种[[格距]]、$130-350\mathrm{MeV}$的[[π介子质量]]范围及多种[[物理体积]]。通过对棘手[[夸克断开贡献]]的精确测定,我们在接近[[物理夸克质量]]的大尺寸精细系综上实现了形状因子前所未有的[[动量分辨率]]。采用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$的大范围[[源汇间距]],可靠地提取了[[零动量转移]]与[[非零动量转移]]下的[[基态矩阵元]]。这使得我们首次能通过所得形状因子$Q^2$依赖性的$z$展开参数化(而非小动量转移下的简单线性近似)获取[[标量半径]]。[[物理外推]]采用三味[[NLO手征微扰理论]],以三个[[低能常数]](包括$L_4^r$的首个[[格点测定值]])参数化[[夸克质量依赖性]]。通过基于[[赤池信息准则]]的[[模型平均方法]],系统评估了[[基态提取]]、形状因子参数化及物理外推对最终结果的[[系统不确定性]]。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':基于属性图的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':摘要:给定[[图]]$G$和[[种子节点]]$v_s$,[[局部图聚类]](LGC)的目标是在与$C_s$大小大致成线性关系的时间内,识别出围绕$v_s$的[[子图]]$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图]]的[[应用场景]]。然而,现有解决方案大多仅依赖图中节点的[[拓扑连接]]关系,容易受到现实[[图数据]]中普遍存在的[[缺失]]或[[噪声链接]]的影响。为解决该问题,本文利用[[图拓扑]]与[[节点属性]]的互补特性来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将LGC建模为[[双向扩散分布]](BDD)的估计问题,该模型专门用于捕捉带属性节点的[[多跳关联性]]。进一步提出[[LACA]]方法——一种高效且具备严格[[理论保证]]的[[LGC]]方案,其核心组件包括:(i) 基于[[理论基础]]的快速[[节点属性预处理]]技术;(ii) 具有[[自适应扩散]]能力和[[加速收敛]]特性的[[向量传播算法]];(iii) 高效的[[三步式BDD近似]]策略。在8个[[真实数据集]]上与17种[[基线方法]]的对比实验表明,LACA在[[真实局部簇]]的[[评估指标]]上全面优于所有对比方法,同时[[速度提升]]达[[数量级]]。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':Scalability Evaluation of HPC Multi-GPU Training for ECG-based LLMs * '''中文标题''':基于心电图的大语言模型多GPU训练的可扩展性评估 * '''发布日期''':2025-03-26 22:48:17+00:00 * '''作者''':Dimitar Mileski, Nikola Petrovski, Marjan Gusev * '''分类''':cs.DC, C.4; I.6 *'''原文链接''':http://arxiv.org/abs/2503.21033v1 '''中文摘要''':摘要:训练[[大型语言模型]]需要大量[[计算处理]],这依赖于众多[[高性能计算]]资源。本研究比较了[[多节点]]与[[多GPU]]环境在[[心电图]]大型语言模型训练中的表现。详细梳理了当前[[分布式深度学习]]框架在多节点和多GPU配置下的应用方案,包括[[Uber]]的[[Horovod]]、[[微软]]的[[DeepSpeed]],以及[[PyTorch]]和[[TensorFlow]]的内置分布式功能。针对不同[[数据集]]配置,我们对比了多种多GPU方案,独立利用多个[[HPC节点]],重点关注[[可扩展性]]、[[加速比]]、[[效率]]和[[开销]]。分析过程采用配备[[SLURM]]调度系统、[[Apptainer]]([[Singularity]])容器、[[CUDA]]、[[PyTorch]]和[[shell脚本]]的[[HPC基础设施]]来支持[[训练工作流]]和[[自动化]]。实验结果显示[[GPU]]数量扩展时获得[[次线性加速比]]:双GPU达1.6倍,四GPU达1.9倍。 == 摘要 == * '''原文标题''':Ion beam treatment of thick polystyrene films * '''中文标题''':厚聚苯乙烯薄膜的离子束处理 * '''发布日期''':2025-03-26 09:39:21+00:00 * '''作者''':Alexey Kondyurin * '''分类''':physics.chem-ph *'''原文链接''':http://arxiv.org/abs/2503.20359v1 '''中文摘要''':摘要:在[[硅片]]上旋涂厚度从78[[纳米]]至1.3[[微米]]不等的[[聚苯乙烯]][[薄膜]],经20 keV[[氮]][[离子束]]处理后,[[椭偏仪]]测量和[[傅里叶变换红外光谱]]显示表面改性层深度与离子在[[聚合物]]中的穿透深度(约70纳米)相符。然而,深层洗涤及后续测试表明,薄改性层中形成的[[自由基]]会迁移至本体层,导致深层聚苯乙烯[[化学结构]]发生系列变化。因此,尽管离子在聚苯乙烯薄膜中的穿透深度较浅,但整个薄膜的改性深度远超离子投射范围。这表明离子束处理仅能条件性地视为表面改性方法,必须考虑自由基反应及其向聚合物深层迁移的可能性。 == 摘要 == * '''原文标题''':Quantum decoherence in the Caldeira-Leggett model by the real-time path integral on a computer * '''中文标题''':计算机实时路径积分下的Caldeira-Leggett模型量子退相干 * '''发布日期''':2025-03-26 16:29:38+00:00 * '''作者''':Jun Nishimura, Hiromasa Watanabe * '''分类''':hep-lat, cond-mat.stat-mech, hep-th, nucl-th, quant-ph *'''原文链接''':http://arxiv.org/abs/2503.20699v1 '''中文摘要''':摘要:我们提出了一种基于实时[[路径积分]]形式的第一性原理计算方法,用于研究[[开放系统]],该方法在[[计算机]]上同时处理[[环境]]和我们感兴趣的[[系统]]。通过采用过去十年发展起来的[[Lefschetz thimble]]方法,可以普遍克服[[蒙特卡洛方法]]应用中的[[符号问题]]。本文重点研究[[Caldeira-Leggett模型]]——该模型尤其以描述[[量子退相干]]现象而闻名。在此模型中,由于典型初始条件下[[路径积分]]呈现[[高斯]]特性,计算过程得到极大简化。通过求解具有庞大但稀疏[[系数矩阵]]的[[线性方程]],可确定唯一且复杂的相关[[鞍点]],并能解析完成[[Lefschetz thimble]]上的积分。由此,我们在无需假设或近似的情况下,获得了长时间演化后对[[环境]]大量[[谐振子]]进行[[迹运算]]得到的[[约化密度矩阵]]。特别地,我们在特定[[参数]]范围内验证了[[退相干时间]]与[[耦合常数]]及[[温度]]的关系——这一关系此前已通过[[主方程]]预测得出。 == 摘要 == * '''原文标题''':Orbital optimization of large active spaces via AI-accelerators * '''中文标题''':基于AI加速器的大活性空间轨道优化 * '''发布日期''':2025-03-26 16:29:44+00:00 * '''作者''':Örs Legeza, Andor Menczer, Ádám Ganyecz, Miklós Antal Werner, Kornél Kapás, Jeff Hammond, Sotiris S. Xantheas, Martin Ganahl, Frank Neese * '''分类''':physics.chem-ph, cond-mat.str-el *'''原文链接''':http://arxiv.org/abs/2503.20700v1 '''中文摘要''':我们提出了一种高效的[[轨道优化]]方法,该方法将高度[[GPU加速]]的[[自旋适应]][[密度矩阵重整化群]]([[DMRG]])与[[ORCA]]程序包中实现的[[量子化学]][[完全活性空间自洽场]]([[CAS-SCF]])方法相结合。利用最新一代[[Nvidia GPU]]硬件的[[计算能力]],我们在包含数千个轨道中数百个电子[[活性空间]]尺寸的[[分子体系]]中,实现了前所未有的[[CAS]]尺寸(82个电子在82个轨道[[CAS(82,82)]])的[[CAS-SCF]]轨道优化。针对[[NVIDIA DGX-A100]]和[[DGX-H100]]硬件,我们对[[多环芳烃]]和不同尺寸[[铁硫复合物]]构成的基准体系进行了详细的[[DMRG-SCF]]方法[[缩放]]和[[误差分析]]。我们的工作首次证明,在[[大键维度]]下进行高精度[[DMRG]]计算对于获得可靠收敛的[[CAS-SCF]][[能量]]至关重要。对于更具挑战性的[[铁硫]]基准体系,我们还发现收敛[[CAS-SCF]]计算的优化轨道对[[DMRG]][[参数]]的敏感性高于[[多环芳烃]]体系。能够在数天内获得如此大尺寸[[活性空间]]的收敛[[CAS-SCF]][[能量]]和[[轨道]],降低了将适当[[轨道]]纳入[[CAS]]或选择正确最小[[CAS]]的挑战,可能为处理[[强关联]][[分子体系]]开辟全新途径。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数极大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':我们研究一维[[高斯分布|高斯]][[位置混合模型]]的[[非参数统计|非参数]][[极大似然估计]]量$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定n个[[数据点]]时该估计量总是返回最多含n个[[分量]]的混合模型,而近期(Wu-Polyanskiy, 2020)对[[亚高斯分布|亚高斯]][[数据]]给出了精确的$O(\log n)$界。本文重点研究$\widehat{\pi}$的[[计算复杂性|计算特性]]:我们提出一种[[算法]],当$\varepsilon>0$足够小时,可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算出[[Wasserstein距离]]意义下的$\varepsilon$[[近似解]],其中$K$与数据相关但与$\varepsilon$无关,$C$为绝对常数,$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的[[原子数]]。我们还可在有限时间内确定性计算出$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有[[密度函数]](相对于[[Lebesgue测度]])的[[概率分布]]独立采样时,这些保证几乎必然成立。我们还证明:当$k\leq \sqrt{n}/3$时,限定为k原子型的$\widehat\pi$条件分布在相应$2k-1$维[[参数空间]]上具有密度函数,且[[EM算法]]几乎必然具有[[局部收敛性|局部线性收敛性]]。关键工具之一是对[[非退化曲线]]的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子间势的聚合物电解质膜质子传输大规模长时原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习原子间势能]]([[MLIPs]])作为一种能够实现大规模、长时间[[原子尺度模拟]]的方法,同时保持与基于[[密度泛函理论]]([[DFT]])和[[从头算波函数理论]]的[[电子结构计算]]相当的精度,引起了广泛关注。然而,基于[[MLIP]]的[[分子动力学]]([[MD]])模拟面临的一个挑战是,与传统[[经典势能]]相比,其[[稳定性]]较低。分析高度[[异质体系]]或[[非晶材料]]通常需要大规模和长时间的模拟,因此需要开发能够进行稳定[[MD模拟]]的鲁棒[[MLIPs]]。在本研究中,我们利用[[神经网络势能]]([[NNP]])生成器,构建了一个[[NNP模型]],能够在广泛[[水合水平]]范围内对[[全氟离子交换膜]]([[Nafion]])进行大规模、长时间的[[MD模拟]]。通过[[主动学习]]循环迭代扩展[[数据集]],我们成功构建了一个鲁棒的[[深度势能]]([[DP]])模型。具体而言,通过将[[非平衡]][[DPMD模拟]]采样的[[非平衡结构]]与结合[[最小原子间距离]]的[[三维结构特征空间]]中的[[结构筛选]]相结合,可以显著增强[[DP模型]]的[[鲁棒性]],从而实现对约10,000至20,000个[[原子]]的大型[[Nafion体系]]进行长达31 ns的稳定[[MD模拟]]。采用所开发的[[DP模型]]进行的[[MD模拟]],与之前较小体系的[[从头算MD模拟]]相比,在广泛[[水合水平]]范围内获得的[[氢原子]][[自扩散系数]]更接近[[实验值]]。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:一个开放、快速、可靠且高效的每日任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过将地址复制到多个位置来实现(例如)降低[[延迟]]和增强[[韧性]]。由于任播在现代[[互联网]]中的关键作用,先前研究已引入工具来执行任播普查。首个工具[[iGreedy]]利用地理分散位置的延迟测量来映射任播部署;第二个工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查,但其准确性和精确性存在缺陷。相反,iGreedy精度极高但速度较慢,且探测成本更高。 本文针对这两个系统的不足,提出了[[MAnycast Reloaded]](MAnycastR)。以MAnycast2为基础,我们彻底重构了其测量流水线,新增分布式探测支持、额外协议([[UDP]]、[[TCP]]和[[IPv6]])支持以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR,与外部任播生产部署进行对比,通过[[RIPE Atlas]]进行广泛延迟测量,并对检测到的60%以上任播前缀进行运营商数据交叉验证。结果表明MAnycastR实现了高准确性与精确度。我们将持续提供每日MAnycastR普查数据,并以宽松[[开源协议]]发布工具源代码。 == 摘要 == * '''原文标题''':Flow of a two-dimensional liquid foam: Impact of surfactant type and boundary conditions * '''中文标题''':二维液体泡沫流动:表面活性剂类型与边界条件的影响 * '''发布日期''':2025-03-26 16:44:40+00:00 * '''作者''':Farshad Nazari, Andrei Potanin, Hadi Mohammadigoushki * '''分类''':cond-mat.soft, physics.flu-dyn *'''原文链接''':http://arxiv.org/abs/2503.20710v1 '''中文摘要''':摘要:本研究通过实验探究了[[二维]]单分散[[水性泡沫]]的[[流变]]与[[流动行为]]。使用自制具有光滑/粗糙[[壁面]]的[[流变光学装置]],在[[平行板]]间对泡沫施加[[剪切]]。实验采用两种商用[[洗涤剂]](Foam1和Foam2)制备泡沫,保持[[气泡尺寸]]和[[液相分数]]相近。[[线性粘弹性]]结果表明:无论[[边界条件]]如何,Foam1始终表现出比Foam2更高的[[弹性模量]]和[[损耗模量]],且粗糙壁面会进一步增强两种泡沫的模量。此外,Foam1的[[粘弹性松弛频率]]较低,表明其[[界面流动性]]较弱。在[[非线性区域]]观察到显著差异:光滑边界条件下,Foam2呈现[[屈服应力]]行为而Foam1没有,尽管后者具有更高的[[粘性应力]]。Foam1的粘性应力与[[毛细管数]]呈比例关系,而Foam2的[[标度关系]]则因光滑/粗糙壁面边界条件呈现不同特征。这些流变行为差异源于[[表面活性剂]]化学性质的不同所导致的界面流动性差异,其中Foam1的界面流动性低于Foam2。 == 摘要 == * '''原文标题''':Search for events with one displaced vertex from long-lived neutral particles decaying into hadronic jets in the ATLAS muon spectrometer in $pp$ collisions at $\sqrt{s}=13$ TeV * '''中文标题''':在$\sqrt{s}=13$ TeV的$pp$对撞中ATLASμ子谱仪内长寿命中性粒子衰变为强子喷注产生单位移顶点的事例搜寻 * '''发布日期''':2025-03-26 11:21:36+00:00 * '''作者''':ATLAS Collaboration * '''分类''':hep-ex *'''原文链接''':http://arxiv.org/abs/2503.20445v1 '''中文摘要''':摘要:本文报道了利用[[ATLAS探测器]]在[[大型强子对撞机]]上收集的数据(2015-2018年记录的140 fb$^{-1}$、$\sqrt{s}=13$ TeV[[质子-质子对撞]]数据)对[[长寿命中性粒子]]衰变为[[强子喷注]]产生[[单位移顶点]]事件的搜寻。该研究采用[[顶点重建]]技术,针对[[μ子谱仪]]中距主相互作用顶点3-14米处衰变的[[长寿命粒子]]。观测事件数与预期本底相符,并确定了若干基准信号模型的限制。研究考虑了[[标量门户模型]]和[[希格斯玻色子]]门户[[重子生成模型]],同时采用专用分析道针对[[Z玻色子]]伴随的长寿命粒子产生过程(包括[[类轴子粒子]]和[[暗光子]]模型)。对于[[希格斯玻色子]]模型,在95%置信水平下排除了长寿命粒子固有衰变长度5厘米至40米范围内分支比高于1%的情况。对于所研究的[[避光类轴子粒子]]模型,本次搜寻对固有衰变长度大于$\mathcal{O}(10)$厘米的情况给出了迄今最强的限制。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':基于属性图的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':摘要:给定[[图]]$G$和[[种子节点]]$v_s$,[[局部图聚类]](LGC)的目标是在与$C_s$大小近似线性时间内识别围绕$v_s$的[[子图]]$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图]]的[[应用场景]]。然而现有方案大多仅依赖图中节点的[[拓扑连接性]],容易受到现实[[图谱]]中普遍存在的[[缺失链接]]或[[噪声链接]]的影响。为解决该问题,本文利用[[图拓扑]]与[[节点属性]]的互补特性来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将LGC建模为[[双向扩散分布]](BDD)估计问题,该模型专门用于捕捉带属性节点的[[多跳关联性]]。进一步提出[[LACA]]方法——一种高效且具备严格[[理论保证]]的[[LGC]]方案:其核心包括(i)基于[[理论基础]]的快速[[节点属性预处理]]技术;(ii)具备[[加速收敛]]特性的[[自适应图向量扩散]]算法;(iii)[[BDD]]近似计算的[[三步优化框架]]。在8个[[真实数据集]]上与17种[[基线方法]]的对比实验表明,LACA在[[真实局部簇]]标准下的结果质量显著优于所有对比方法,同时速度可提升数个[[数量级]]。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重构动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成任何社会的结构性支柱。它们通过协调地球上几乎每一个个体,形成了为所有人生产一切的社会[[新陈代谢系统]]。供应链网络绝非静态存在,而是通过[[企业]]的进出与[[供应关系]]的[[重组]]不断变化。本文利用独特[[数据集]]研究了一个国家供应链网络中企业及其[[供应商]]-[[客户关系]]的[[时间演化]]。基于[[匈牙利]]2014至2022年按月申报的[[增值税]]数据,我们重建了包含711,248家企业和38,644,400条连接的完整[[经济网络]],以企业级[[分辨率]]覆盖了整个[[经济体]]的几乎所有[[重构事件]]。研究发现:每年约25%的企业退出供应链网络,同时28%的新企业加入;平均55%的现存[[供应链接]]会在次年消失;供应链接的[[半衰期]]为13个月。新链接以[[超偏好依附]]方式连接企业,概率满足$p(i)\propto k_i^{1.08}$($k_i$表示企业$i$的供应连接数)。我们校准了一个能复现匈牙利主导供应链网络典型特征的简单[[统计网络]]生成模型,该模型不仅再现了[[入度]]/[[出度分布]]、[[同配性]]和[[聚类结构]]等局部网络特征,还捕捉了真实的[[系统性风险]]特征。最后讨论了当前模型如何通过[[经济重连]]动态来量化[[系统韧性]]并评估[[冲击传导]]。 == 摘要 == * '''原文标题''':The Scalar Size of the Pion from Lattice QCD * '''中文标题''':格点QCD中π介子的标量大小 * '''发布日期''':2025-03-26 16:20:11+00:00 * '''作者''':Konstantin Ottnad, Georg von Hippel * '''分类''':hep-lat, hep-ph *'''原文链接''':http://arxiv.org/abs/2503.20687v1 '''中文摘要''':我们提出了一种[[系统误差]]完全受控的[[格点QCD]]计算,用于确定[[π介子]]标量形状因子及相关半径。计算结果基于17个[[规范场]]组态的大规模集合,采用$N_f=2+1$味的[[Wilson-Clover]]改进[[海夸克]]。这些组态覆盖了从$a=0.049\mathrm{fm}$到$a=0.086\mathrm{fm}$四种[[格距]],$130-350\mathrm{MeV}$的[[π介子]]质量范围以及多种[[物理体积]]。通过精确计算著名的[[夸克断开贡献]],我们在接近[[物理夸克质量]]的大体积精细组态上实现了形状因子前所未有的[[动量分辨率]]。采用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$范围内多种[[源汇间距]],可靠地提取了[[零动量转移]]与[[非零动量转移]]下的[[基态矩阵元]]。这使得我们首次能够通过所得形状因子$Q^2$依赖性的$z$展开参数化(而非小动量转移下的简单线性近似)获得[[标量半径]]。使用三味[[NLO手征微扰理论]]对半径进行[[物理外推]],通过三个[[低能常数]](包括首次格点确定的$L_4^r$)参数化[[夸克质量]]依赖性。基于[[赤池信息准则]]的[[模型平均]]方法,系统评估了[[基态提取]]、形状因子参数化以及物理外推对最终结果的[[系统不确定性]]。 == 摘要 == * '''原文标题''':Ion beam treatment of thick polystyrene films * '''中文标题''':厚聚苯乙烯薄膜的离子束处理 * '''发布日期''':2025-03-26 09:39:21+00:00 * '''作者''':Alexey Kondyurin * '''分类''':physics.chem-ph *'''原文链接''':http://arxiv.org/abs/2503.20359v1 '''中文摘要''':摘要:在[[硅片]]上旋涂厚度为78[[纳米]]至1.3[[微米]]的不同厚度[[聚苯乙烯]][[薄膜]],并用能量为20 [[keV]]的[[氮离子]]进行处理。[[椭圆偏振测量]]和[[傅里叶变换红外光谱]]显示,表面层的改性对应于离子在[[聚合物]]中的[[穿透深度]](约70纳米)。然而,对深层进行清洗和后续测量表明,在薄改性层中形成的[[自由基]]会迁移到[[体层]]中,并引起深层聚苯乙烯[[化学结构]]的多种变化。因此,尽管离子在聚苯乙烯薄膜中的穿透深度较小,但整个薄膜的[[改性深度]]远大于离子的[[投影射程]]。因此,[[离子束]]处理聚合物仅在条件上是一种[[表面改性]]方法。必须考虑[[自由基反应]]及其向聚合物深层迁移的可能性。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数极大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':我们研究一维[[高斯分布|高斯]][[位置混合]]的[[非参数统计|非参数]][[极大似然估计]]量$\widehat{\pi}$。自(Lindsay, 1983)以来已知:给定n个[[数据点]]时,该估计量始终返回最多含n个[[混合模型]];近期(Wu-Polyanskiy, 2020)进一步对[[次高斯分布|次高斯]][[数据]]给出了精确的$O(\log n)$界。本文重点研究$\widehat{\pi}$的[[计算复杂性|计算特性]]:我们提出一种[[算法]],当$\varepsilon>0$足够小时,可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算出[[Wasserstein距离]]意义上的$\varepsilon$[[近似解]],其中$K$与数据相关但与$\varepsilon$无关,$C$为[[绝对常数]],$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的[[原子数量]]。我们还实现了[[支撑集]]基数$|supp(\widehat\pi)|$的[[有限时间]]可验证计算。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$来自具有[[Lebesgue测度]][[概率密度函数|密度]]的[[独立分布]]时,这些保证几乎必然成立。此外,我们证明当$k\leq \sqrt{n}/3$时,限定为k原子结构的$\widehat\pi$[[条件分布]]在相应$2k-1$维[[参数空间]]上具有密度,且[[EM算法]]几乎必然[[局部收敛|局部线性收敛]]。关键工具之一是[[非退化曲线]]的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':Orbital optimization of large active spaces via AI-accelerators * '''中文标题''':基于AI加速器的大活性空间轨道优化方法 * '''发布日期''':2025-03-26 16:29:44+00:00 * '''作者''':Örs Legeza, Andor Menczer, Ádám Ganyecz, Miklós Antal Werner, Kornél Kapás, Jeff Hammond, Sotiris S. Xantheas, Martin Ganahl, Frank Neese * '''分类''':physics.chem-ph, cond-mat.str-el *'''原文链接''':http://arxiv.org/abs/2503.20700v1 '''中文摘要''':我们提出了一种高效的[[轨道优化]]方法,该方法将高度[[GPU加速]]的[[自旋适应]][[密度矩阵重整化群]]([[DMRG]])与[[ORCA]]程序包中实现的[[量子化学]][[完全活性空间自洽场]]([[CAS-SCF]])方法相结合。利用最新一代[[Nvidia GPU]]硬件的[[计算能力]],我们在包含数千个轨道中数百个电子[[活性空间]]尺寸的[[分子体系]]中,实现了前所未有的[[CAS]]尺寸轨道优化——高达82个电子和82个轨道[[CAS(82,82)]]。针对[[NVIDIA DGX-A100]]和[[DGX-H100]]硬件,我们对[[多环芳烃]]和不同尺寸[[铁硫配合物]][[基准体系]]进行了详细的[[DMRG-SCF]]方法[[缩放]]和[[误差分析]]。研究首次证明:在[[大键维度]]下进行[[高精度]][[DMRG计算]]对获得可靠收敛的[[CAS-SCF能量]]至关重要。对于更具挑战性的[[铁硫]][[基准体系]],我们还发现收敛[[CAS-SCF计算]]的优化轨道对[[DMRG参数]]的[[敏感性]]高于[[多环芳烃]]体系。能在数日内获得如此大尺寸[[活性空间]]的收敛[[CAS-SCF能量]]和轨道,不仅降低了将适当轨道纳入[[CAS]]或选择正确最小[[CAS]]的挑战,还可能为处理[[强关联]][[分子体系]]开辟全新途径。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习原子间势]]([[MLIP]]s)作为一种能够实现大规模、长时间[[原子模拟]]并保持与基于[[密度泛函理论]]([[DFT]])和[[从头算波函数理论]]的[[电子结构计算]]相当精度的方法,受到了广泛关注。然而,基于[[MLIP]]的[[分子动力学]]([[MD]])模拟面临的关键挑战是其稳定性低于传统[[经典势函数]]。分析高度异质体系或[[非晶材料]]通常需要大规模长时间模拟,这要求开发能够实现稳定[[MD模拟]]的鲁棒性[[MLIP]]。本研究利用我们的[[神经网络势]]([[NNP]])生成器,构建了一个能在广泛[[水合]]水平范围内对[[全氟离聚物膜]]([[Nafion]])进行大规模长时间[[MD模拟]]的[[NNP模型]]。通过[[主动学习]]循环迭代扩展数据集,我们成功建立了鲁棒的[[深度势]]([[DP]])模型。具体而言,通过将非平衡[[DPMD]]模拟采样的非平衡结构与结合最小[[原子间距]]的三维[[结构特征空间]]筛选相结合,可显著提升[[DP模型]]的鲁棒性,从而实现对约10,000至20,000[[原子]]的大型[[Nafion]]体系进行长达31[[纳秒]]的稳定[[MD模拟]]。采用所开发[[DP模型]]的[[MD模拟]]获得的[[氢原子]]自[[扩散系数]],在广泛[[水合]]水平范围内比先前小体系[[从头算MD模拟]]结果更接近[[实验值]]。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':多播重装上阵:面向开放、快速、可靠且高效日常多播普查的工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过将地址复制到多个位置来实现降低[[延迟]]和增强[[韧性]]等目标。鉴于[[任播]]在现代[[互联网]]中的关键作用,先前研究已开发了执行任播普查的工具。首个工具[[iGreedy]]利用地理分散位置的延迟测量来绘制任播部署图;第二个工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查,但存在[[准确性]]和[[精确性]]问题。反之,iGreedy精度极高但速度较慢,且探测成本更高。 本文针对这两个系统的缺陷提出了[[MAnycast Reloaded]](MAnycastR)。以MAnycast2为基础,我们彻底重构了其测量管道,新增[[分布式探测]]支持、额外[[协议]]([[UDP]]、[[TCP]]和[[IPv6]])支持以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR,对比实际任播生产部署,通过[[RIPE Atlas]]进行广泛延迟测量,并将检测到的任播前缀中超过60%与运营商真实数据进行交叉验证。结果表明MAnycastR实现了高准确性与精确度。我们以宽松的[[开源许可]]向社区提供每日持续的MAnycastR普查数据,并公开该工具的[[源代码]]。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':基于属性图的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':摘要:给定[[图]]$G$和[[种子节点]]$v_s$,[[局部图聚类]]([[LGC]])的目标是在与$C_s$大小大致成线性关系的时间内,识别出围绕$v_s$的[[子图]]$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图]]的[[应用场景]]。然而,现有解决方案大多仅依赖图中节点的[[拓扑连接]]关系,容易受到现实图数据中普遍存在的[[缺失边]]或[[噪声边]]的影响。为解决该问题,本文利用[[图拓扑]]与[[节点属性]]的互补特性来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将[[LGC]]问题建模为[[双向扩散分布]]([[BDD]])估计问题,该模型专门用于捕捉带属性节点的[[多跳关联性]]。进一步提出[[LACA]]方法——一种高效且具备严格[[理论保证]]的[[LGC]]解决方案:其核心包括(i)基于[[理论基础]]的快速[[节点属性预处理]]技术,(ii)具备[[加速收敛]]特性的[[自适应向量扩散算法]],以及(iii)[[BDD]]近似计算的[[三步优化方案]]。在8个[[真实数据集]]上与17种[[基线方法]]的对比实验表明,[[LACA]]在真实[[局部簇]]的[[评估指标]]上全面优于所有对比方法,同时实现[[数量级]]的[[速度提升]]。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重连动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成任何[[社会]]的[[结构性支柱]]。它们通过协调[[地球]]上几乎每一个[[个体]],形成了为所有人生产一切的[[社会代谢系统]]。SCN绝非[[静态]]存在,而是通过[[企业]]的进出与[[供应关系]]的[[重组]]持续[[演变]]。本研究利用独特[[数据集]]追踪了一个[[国家]]供应链网络中企业及其供需关系的[[时序演化]]。基于[[匈牙利]]2014至2022年按月申报的[[增值税]]数据,我们重建了包含711,248家企业和38,644,400条连接的[[整体经济网络]],实现了[[企业级分辨率]]的[[经济结构]][[全息记录]]。研究发现:每年约25%的企业退出SCN,同时28%的新企业加入;平均55%的年度供应关系会在次年消失;[[供应关系]]的[[半衰期]]为13个月。新连接以[[超偏好依附]]概率$p(i)\propto k_i^{1.08}$($k_i$表示企业i的[[连接数]])形成。我们校准的简易[[统计网络]][[生成模型]]成功复现了匈牙利主导SCN的[[典型特征]],不仅能重现[[入/出度分布]]、[[同配性]]和[[聚类结构]]等[[局部特征]],还能捕捉真实的[[系统性风险]][[轮廓]]。该模型揭示了[[经济网络]][[重连动力学]]对量化[[系统韧性]]和估计[[冲击传导]]的[[关键作用]]。 == 摘要 == * '''原文标题''':The Scalar Size of the Pion from Lattice QCD * '''中文标题''':格点QCD中π介子的标量大小 * '''发布日期''':2025-03-26 16:20:11+00:00 * '''作者''':Konstantin Ottnad, Georg von Hippel * '''分类''':hep-lat, hep-ph *'''原文链接''':http://arxiv.org/abs/2503.20687v1 '''中文摘要''':我们提出了一种[[系统误差]]完全受控的[[格点QCD]]计算,用于确定[[π介子]]标量[[形状因子]]及相关[[半径]]。计算结果基于17个[[规范系综]]的大规模数据集,这些系综采用$N_f=2+1$[[威尔逊Clover改进海夸克]]配置,涵盖$a=0.049\mathrm{fm}$至$a=0.086\mathrm{fm}$四种[[晶格间距]]、$130-350\mathrm{MeV}$的[[π介子质量]]范围及多种[[物理体积]]。通过对棘手[[夸克断开贡献]]的精确测定,我们在接近[[物理夸克质量]]的大尺寸精细系综上实现了形状因子前所未有的[[动量分辨率]]。采用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$的大范围[[源汇间距]],可靠地提取了[[零动量转移]]与[[非零动量转移]]下的[[基态矩阵元]]。这使得我们首次能通过所得形状因子$Q^2$依赖性的$z$展开参数化(而非小动量转移下的简单线性近似)获取[[标量半径]]。[[物理外推]]采用三味[[NLO手征微扰理论]],以三个[[低能常数]](包括$L_4^r$的首个[[格点测定]]值)参数化[[夸克质量]]依赖性。通过基于[[赤池信息准则]]的[[模型平均]],系统评估了[[基态提取]]、形状因子参数化及物理外推对最终结果的[[系统不确定性]]。 == 摘要 == * '''原文标题''':Ion beam treatment of thick polystyrene films * '''中文标题''':厚聚苯乙烯薄膜的离子束处理 * '''发布日期''':2025-03-26 09:39:21+00:00 * '''作者''':Alexey Kondyurin * '''分类''':physics.chem-ph *'''原文链接''':http://arxiv.org/abs/2503.20359v1 '''中文摘要''':摘要:在[[硅片]]上旋涂厚度为78纳米至1.3微米的不同厚度[[聚苯乙烯]]薄膜,采用能量为20 keV的[[氮离子束]]进行处理。[[椭偏仪]]测量和[[傅里叶变换红外光谱]]显示,表面层的改性对应于离子在[[聚合物]]中的[[穿透深度]](约70纳米)。然而,对深层进行清洗和后续测量表明,在薄改性层中形成的[[自由基]]会迁移至本体层,并导致深层[[聚苯乙烯]]化学结构发生一系列变化。因此,尽管离子在[[聚苯乙烯]]薄膜中的[[穿透深度]]较小,但整个薄膜的改性深度远大于离子的[[投影射程]]。由此可见,[[聚合物]]离子束处理仅在特定条件下可视为[[表面改性]]方法。必须考虑[[自由基反应]]及其向[[聚合物]]深层迁移的可能性。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数最大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':我们研究一维[[高斯分布|高斯]][[位置混合模型]]的[[非参数统计|非参数]][[最大似然估计]]量$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定n个[[数据点]]时,该估计量总是返回最多含n个分量的[[混合模型]],而近期(Wu-Polyanskiy, 2020)对[[亚高斯分布|亚高斯]]数据给出了严格的$O(\log n)$界。本文研究$\widehat{\pi}$的计算特性:我们提出的[[算法]]能在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算[[Wasserstein距离]]下的$\varepsilon$[[近似解]],其中$K$与$\varepsilon$无关但依赖数据,$C$为[[绝对常数]],$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的[[原子数]]。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$来自具有[[概率密度函数|密度]](相对于[[Lebesgue测度]])的[[概率分布]]时,这些保证几乎必然成立。我们进一步证明:当$k\leq \sqrt{n}/3$时,限定为k原子结构的$\widehat\pi$条件分布在相关$2k-1$维[[参数空间]]上存在密度,且[[EM算法]]几乎必然具有[[收敛速度|局部线性收敛性]]。关键工具之一是[[非退化曲线]]的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习原子间势]]([[MLIPs]])作为一种能够实现大规模、长时间[[原子模拟]]的方法备受关注,同时保持与基于[[密度泛函理论]]([[DFT]])和[[从头算波函数理论]]的[[电子结构计算]]相当的精度。然而,基于[[MLIP]]的[[分子动力学]]([[MD]])模拟面临的挑战是其稳定性低于使用传统[[经典势]]的模拟。分析高度异质体系或[[非晶材料]]通常需要大规模和长时间的模拟,因此需要开发能够实现稳定[[MD模拟]]的鲁棒[[MLIPs]]。在本研究中,我们利用[[神经网络势]]([[NNP]])生成器,构建了一个[[NNP模型]],能够在广泛[[水合水平]]下对[[全氟离聚物膜]]([[Nafion]])进行大规模、长时间的[[MD模拟]]。通过[[主动学习]]循环迭代扩展数据集,我们成功建立了鲁棒的[[深度势]]([[DP]])模型。具体而言,通过将非平衡[[DPMD模拟]]采样的非平衡结构与结合最小原子间距离的[[三维结构特征空间]]中的结构筛选相结合,可以显著增强[[DP模型]]的鲁棒性,从而实现对约10,000至20,000个原子的大型[[Nafion]]体系进行长达31 ns的稳定[[MD模拟]]。采用所开发[[DP模型]]的[[MD模拟]]获得的[[氢原子]]自[[扩散系数]],在广泛[[水合水平]]范围内与[[实验值]]更为接近,优于先前对小体系进行的[[从头算MD模拟]]结果。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':多播重装上阵:一个开放、快速、可靠且高效的日常多播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过在多位置复制地址来实现降低[[延迟]]和增强[[韧性]]等目标。由于任播在现代[[互联网]]中的关键作用,先前研究已开发了多种任播普查工具。首款工具[[iGreedy]]通过地理分散的延迟测量来绘制任播部署图;第二款工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——仅需3小时即可完成全网普查,但存在[[准确性]]和[[精确度]]问题。反之,iGreedy精度极高但速度较慢,且探测成本显著更高。 本文针对这两个系统的缺陷,提出了升级版[[MAnycast Reloaded]](MAnycastR)。以MAnycast2为基础,我们彻底重构了其测量流程,新增[[分布式探测]]支持、多协议([[UDP]]/[[TCP]]/[[IPv6]])兼容性以及类似iGreedy的延迟测量功能。通过在含32个全球分布式节点的任播测试床上验证,与真实任播生产环境对比,并利用[[RIPE Atlas]]进行大规模延迟测量交叉检验(其中60%以上检测到的任播前缀通过运营商真实数据复核),证明MAnycastR具备高准确性与精确度。我们将持续提供每日任播普查数据,并以宽松[[开源协议]]发布工具[[源代码]]。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':基于属性图的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':摘要:给定[[图]]$G$和[[种子节点]]$v_s$,[[局部图聚类]]([[LGC]])的目标是在与$C_s$大小近似线性相关的时间内,识别出围绕$v_s$的[[子图]]$C_s$(即[[局部簇]])。该方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图]]的[[应用场景]]。然而现有方案大多仅依赖图中节点的[[拓扑连接性]],容易受到现实[[图数据]]中普遍存在的[[缺失链接]]或[[噪声链接]]的影响。为解决该问题,本文利用[[图拓扑]]与[[节点属性]]的互补特性来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将[[LGC]]建模为[[双向扩散分布]]([[BDD]])的估计问题,该模型专门用于捕捉含属性图中节点的[[多跳关联性]]。进一步提出[[LACA]]方法——一种高效且具备强[[局部性]]的[[LGC]]解决方案,在多个[[真实数据集]]上展现出卓越性能。其核心组件包括:(i)基于理论基础的快速[[节点属性预处理]]技术;(ii)具备严格理论保证和加速收敛特性的[[自适应向量扩散算法]];(iii)高效的[[三步式BDD近似]]方案。通过在8个[[真实数据集]]上与17种[[对比方法]]的实验表明,[[LACA]]在真实[[局部簇]]标准下的结果质量优于所有[[对比方法]],同时速度可提升数个数量级。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重构动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成了任何[[社会]]的[[结构性支柱]]。它们通过协调地球上几乎每一个个体,形成了为所有人生产一切的[[社会新陈代谢系统]]。供应链网络绝非静态,而是通过[[企业]]的进出和[[供应关系]]的[[重组]]不断变化。本文利用独特[[数据集]]研究了一个[[国家]]供应链网络中企业及其[[供应商]]-[[买方]]关系的[[时间演化]]。基于[[匈牙利]]2014至2022年每月报告的[[增值税]]数据,我们重建了包含711,248家企业和38,644,400条连接的[[整体经济网络]],以企业级[[分辨率]]覆盖了几乎整个[[经济体]]的所有[[重构事件]]。研究发现:每年约25%的企业退出供应链网络,同时28%的[[新企业]]加入;平均55%的现有[[供应链接]]会在次年消失;供应链接的[[半衰期]]为13个月。新链接以[[超偏好依附]]概率$p(i)\propto k_i^{1.08}$($k_i$表示企业i的[[供应连接数]])附着于企业。我们校准了一个能复现匈牙利主导供应链网络典型特征的简单[[统计网络生成模型]],该模型不仅复现了[[入/出度分布]]、[[同配性]]和[[聚类结构]]等[[局部网络特征]],还捕捉了真实的[[系统性风险]]特征。最后讨论了该模型如何通过[[经济重连动态]]来量化[[系统韧性]]和估计[[冲击传导]]。 == 摘要 == * '''原文标题''':The Scalar Size of the Pion from Lattice QCD * '''中文标题''':π介子标量尺寸的格点QCD计算 * '''发布日期''':2025-03-26 16:20:11+00:00 * '''作者''':Konstantin Ottnad, Georg von Hippel * '''分类''':hep-lat, hep-ph *'''原文链接''':http://arxiv.org/abs/2503.20687v1 '''中文摘要''':我们采用[[格点QCD]]方法计算了[[π介子]]标量形状因子及相关半径,并实现了[[系统误差]]的完全控制。计算结果基于17组N_f=2+1[[威尔逊Clover改进海夸克]]的规范系综,涵盖0.049-0.086fm四种[[晶格间距]]、130-350MeV的[[π介子质量]]范围及多种[[物理体积]]。通过对著名的[[夸克断开贡献]]的精确测定,我们在接近[[物理夸克质量]]的大尺寸精细系综上实现了[[形状因子]]前所未有的[[动量分辨率]]。采用1.0-3.25fm宽范围的[[源汇分离距离]],可靠地提取了[[零动量转移]]和[[非零动量转移]]下的[[基态矩阵元]]。这使得我们首次能通过形状因子Q^2依赖性的[[z-展开]]参数化(而非小动量转移下的简单线性近似)获得[[标量半径]]。使用三味[[NLO手征微扰理论]]将[[夸克质量]]依赖性参数化为三个[[低能常数]](包含[[L_4^r]]的首次[[格点测定]])进行[[物理外推]],并通过基于[[赤池信息准则]]的[[模型平均]]方法处理[[基态提取]]、形状因子参数化及物理外推相关的系统误差。 == 摘要 == * '''原文标题''':Ion beam treatment of thick polystyrene films * '''中文标题''':厚聚苯乙烯薄膜的离子束处理 * '''发布日期''':2025-03-26 09:39:21+00:00 * '''作者''':Alexey Kondyurin * '''分类''':physics.chem-ph *'''原文链接''':http://arxiv.org/abs/2503.20359v1 '''中文摘要''':摘要:在[[硅片]]上旋涂厚度为78纳米至1.3微米的[[聚苯乙烯]]薄膜,经20 keV[[氮离子]]束处理后,[[椭圆偏振测量]]和[[傅里叶变换红外光谱]]显示表面改性层对应于离子在[[聚合物]]中的[[穿透深度]](约70纳米)。然而,深层洗涤及后续测量表明,薄改性层中形成的[[自由基]]会迁移至[[本体层]],导致深层[[聚苯乙烯]]化学结构发生一系列变化。因此,尽管离子在[[聚苯乙烯]]薄膜中的[[穿透深度]]较浅,但整个薄膜的改性深度远超过离子的[[投影射程]]。由此可见,[[聚合物]]离子束处理仅在特定条件下属于[[表面改性]]方法,必须考虑[[自由基反应]]及其向[[聚合物]]深层迁移的可能性。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数最大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':摘要:我们研究一维[[高斯分布|高斯]]位置混合的非参数[[极大似然估计]]量$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定n个[[数据点]]时,该估计量始终返回最多含n个分量的[[混合模型]],而近期(Wu-Polyanskiy, 2020)对[[亚高斯分布|亚高斯]]数据给出了尖锐的$O(\log n)$界。本文研究$\widehat{\pi}$的计算特性:针对足够小的$\varepsilon>0$,我们提出[[算法]]可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算[[Wasserstein距离]]意义上的$\varepsilon$近似解,其中$K$与数据相关但与$\varepsilon$无关,$C$为绝对常数,$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的原子数。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有[[概率密度函数|密度]](相对于[[Lebesgue测度]])的[[概率分布]]独立采样时,这些保证几乎必然成立。我们还证明:当$k\leq \sqrt{n}/3$时,限定为k原子性的$\widehat\pi$条件分布在相应$2k-1$维[[参数空间]]上具有密度,且[[EM算法]]几乎必然局部[[线性收敛]]。关键工具之一是非退化曲线的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子势的大规模长时质子交换膜质子传输原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习原子间势]]([[MLIPs]])作为一种能够实现大规模、长时间[[原子模拟]]的方法备受关注,同时保持与基于[[密度泛函理论]]([[DFT]])和[[从头算波函数理论]]的[[电子结构计算]]相当的精度。然而,基于[[MLIP]]的[[分子动力学]]([[MD]])模拟面临的挑战是其稳定性低于使用传统[[经典势]]的模拟。分析高度异质体系或[[非晶材料]]通常需要大规模和长时间的模拟,因此需要开发能够进行稳定[[MD模拟]]的鲁棒[[MLIPs]]。在本研究中,我们利用[[神经网络势]]([[NNP]])生成器,构建了一个[[NNP模型]],能够在广泛[[水合水平]]下对[[全氟离聚物膜]]([[Nafion]])进行大规模、长时间的[[MD模拟]]。通过[[主动学习]]循环迭代扩展数据集,我们成功构建了鲁棒的[[深度势]]([[DP]])模型。具体而言,通过结合非平衡[[DPMD]]模拟采样的非平衡结构,以及在包含最小[[原子间距离]]的[[3D结构特征空间]]中进行结构筛选,可以显著增强[[DP模型]]的鲁棒性,从而实现对约10,000至20,000个[[原子]]的大型[[Nafion系统]]进行长达31 ns的稳定[[MD模拟]]。采用所开发[[DP模型]]的[[MD模拟]]得到的[[氢原子]]自[[扩散系数]],在广泛[[水合水平]]范围内与[[实验值]]更为接近,优于先前对小体系进行的[[从头算MD模拟]]结果。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:开放、快速、可靠且高效的日常任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过将地址复制到多个位置来实现降低[[延迟]]和增强[[韧性]]等目标。由于[[任播]]在现代[[互联网]]中的关键作用,先前研究已开发了执行任播普查的工具。首个工具[[iGreedy]]利用地理分散位置的延迟测量来绘制任播部署图;第二个工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——仅需3小时即可完成全网普查,但存在[[准确性]]和[[精确性]]问题。相反,iGreedy准确性极高但速度较慢,且[[探测成本]]更高。 本文针对这两个系统的缺陷提出了[[MAnycast Reloaded]](MAnycastR)。以MAnycast2为基础,我们彻底重新设计了其测量流程,新增了[[分布式探测]]支持、额外[[协议]]([[UDP]]、[[TCP]]和[[IPv6]])支持以及类似iGreedy的延迟测量功能。我们在包含32个全球分布式节点的任播[[测试平台]]上验证MAnycastR,与外部任播[[生产部署]]进行对比,并通过[[RIPE Atlas]]进行广泛延迟测量,同时对检测到的60%以上任播[[前缀]]进行[[运营商]]实地验证[[交叉检查]]。结果表明MAnycastR实现了高准确性和[[精确度]]。我们将持续提供每日MAnycastR普查数据,并以宽松的[[开源许可协议]]发布该工具的[[源代码]]。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':基于属性图的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':摘要:给定[[图]]$G$和[[种子节点]]$v_s$,[[局部图聚类]](LGC)的目标是在与$C_s$大小大致成线性关系的时间内,识别出围绕$v_s$的[[子图]]$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图]]的[[应用场景]]。然而,现有解决方案大多仅依赖图中节点的[[拓扑连接性]],容易受到现实图数据中普遍存在的[[缺失]]或[[噪声链接]]的影响。为解决该问题,本文利用[[图拓扑]]与[[节点属性]]的[[互补特性]]来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将LGC建模为[[双向扩散分布]](BDD)的[[估计问题]],该模型专门用于捕捉带属性节点的[[多跳关联性]]。进一步提出[[LACA]]方法——一种高效且具备强[[局部性]]的LGC解决方案,在多个[[真实数据集]]上表现出[[卓越性能]]。其核心组件包括:(i) 基于[[理论基础]]的快速[[节点属性预处理]]技术,(ii) 具有严格[[理论保证]]和[[加速收敛]]特性的[[自适应向量扩散算法]],(iii) 高效的[[三步式BDD近似方案]]。通过在8个[[真实数据集]]上与17种[[对比方法]]的实验表明,LACA在[[真实局部簇标准]]下的[[结果质量]]优于所有对比方法,同时[[速度]]可提升数个[[数量级]]。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重构动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成任何[[社会]]的[[结构性支柱]]。它们通过协调[[地球]]上几乎每一个[[个体]],形成了为所有人生产一切的[[社会新陈代谢系统]]。SCN绝非[[静态存在]],而是通过[[企业]]的进出与[[供应关系]]的[[重组]]持续[[演变]]。本研究利用独特[[数据集]]追踪了一个[[国家]]SCN中企业及其[[供应商]]-[[客户关系]]的[[时间演化]]。基于[[匈牙利]]2014至2022年每月报告的[[增值税]]数据,我们重建了包含711,248家企业和38,644,400条连接的[[整体经济网络]],以[[企业级分辨率]]覆盖了近乎所有[[经济重构事件]]。研究发现:每年约25%的企业退出SCN,同时28%的[[新企业]]加入;平均55%的[[现存供应链接]]会在次年消失;[[供应链接]]的[[半衰期]]为13个月。[[新链接]]以[[超偏好依附]]方式连接企业,概率满足$p(i)\propto k_i^{1.08}$($k_i$表示企业i的[[供应连接数]])。我们校准了一个能复现匈牙利主导SCN典型特征的[[统计网络生成模型]],该模型不仅再现了[[入/出度分布]]、[[同配性]]和[[聚类结构]]等[[局部网络特征]],还捕捉了真实的[[系统性风险]]轮廓。最后探讨了[[经济重连动态]]对量化[[系统韧性]]和估计[[冲击传导]]的关键作用。 == 摘要 == * '''原文标题''':The Scalar Size of the Pion from Lattice QCD * '''中文标题''':π介子标量尺寸的格点QCD计算 * '''发布日期''':2025-03-26 16:20:11+00:00 * '''作者''':Konstantin Ottnad, Georg von Hippel * '''分类''':hep-lat, hep-ph *'''原文链接''':http://arxiv.org/abs/2503.20687v1 '''中文摘要''':我们提出了一种[[系统误差]]完全受控的[[格点QCD]]计算,用于确定[[π介子]][[标量形状因子]]及相关[[半径]]。计算结果基于17个[[规范系综]]的大规模数据集,这些系综采用$N_f=2+1$[[威尔逊Clover改进]]的[[海夸克]]。这些系综覆盖了从$a=0.049\mathrm{fm}$到$a=0.086\mathrm{fm}$四种[[格点间距]],[[π介子质量]]范围为$130-350\mathrm{MeV}$以及多种[[物理体积]]。通过精确计算著名的[[夸克断开贡献]],我们首次在接近[[物理夸克质量]]的大尺寸精细系综上实现了形状因子前所未有的[[动量分辨率]]。采用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$的大范围[[源汇间距]],可靠地提取了[[零动量转移]]和[[非零动量转移]]下的相关[[基态矩阵元]]。这使得我们首次能够通过所得形状因子$Q^2$依赖性的[[$z$展开]]参数化(而非小动量转移下的简单[[线性近似]])来获取[[标量半径]]。半径的[[物理外推]]采用三味[[NLO手征微扰理论]],通过三个[[低能常数]](包括$L_4^r$的首次[[格点测定]])来参数化[[夸克质量依赖性]]。基于[[赤池信息准则]]的[[模型平均]]方法,我们对[[基态提取]]、形状因子参数化以及物理外推等环节产生的系统误差进行了量化处理。 == 摘要 == * '''原文标题''':Ion beam treatment of thick polystyrene films * '''中文标题''':厚聚苯乙烯薄膜的离子束处理 * '''发布日期''':2025-03-26 09:39:21+00:00 * '''作者''':Alexey Kondyurin * '''分类''':physics.chem-ph *'''原文链接''':http://arxiv.org/abs/2503.20359v1 '''中文摘要''':在[[硅片]]上旋涂的不同厚度(78[[纳米]]至1.3[[微米]])[[聚苯乙烯]][[薄膜]]经20 keV[[氮]][[离子束]]处理后,[[椭偏仪]]测量和[[傅里叶变换红外光谱]]显示表面改性层深度与离子在[[聚合物]]中的穿透深度(约70纳米)相符。然而,深层洗涤及后续测试表明,薄改性层中形成的[[自由基]]会迁移至本体层,导致深层聚苯乙烯[[化学结构]]发生系列变化。因此,尽管离子在聚苯乙烯膜中的穿透深度较浅,整个薄膜的改性深度仍远超过[[离子投影射程]]。这表明离子束处理仅能有条件地视为[[表面改性]]方法,必须考虑自由基反应及其向聚合物深层迁移的可能性。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数极大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':我们研究一维[[高斯分布|高斯]][[位置混合模型]]的[[非参数统计|非参数]][[最大似然估计]]量$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定n个[[数据点]]时该估计量总是返回最多含n个[[混合模型|分量]]的混合模型,而近期(Wu-Polyanskiy, 2020)对[[亚高斯分布|亚高斯数据]]给出了严格的$O(\log n)$界。本文重点研究$\widehat{\pi}$的[[计算复杂性|计算特性]]:我们提出的[[算法]]能在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算出[[Wasserstein距离]]意义上的$\varepsilon$[[近似算法|近似解]],其中$K$与数据相关但与$\varepsilon$无关,$C$为[[绝对常数]],$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的[[原子(测度论)|原子]]数量。该算法还能在有限时间内[[确定性算法|确定性地计算]]$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$中的点独立采样自具有[[Lebesgue测度]][[概率密度函数|密度]]的[[概率分布]]时,这些保证几乎必然成立。我们还证明:当$k\leq \sqrt{n}/3$时,限定为k原子型的$\widehat\pi$[[条件分布]]在相应$2k-1$维[[参数空间]]上存在密度函数,且[[EM算法]]几乎必然具有[[收敛速度|局部线性收敛性]]。关键工具之一是对[[非退化曲线]]的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子势的大规模长时质子传输聚合物电解质膜原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习原子间势能]]([[MLIPs]])作为一种能够实现大规模、长时间[[原子模拟]]并保持与基于[[密度泛函理论]]([[DFT]])和[[从头算波函数理论]]的[[电子结构计算]]相当精度的方法,受到广泛关注。然而,基于[[MLIP]]的[[分子动力学]]([[MD]])模拟面临的关键挑战是其稳定性低于传统[[经典势能]]方法。分析高度异质体系或[[非晶材料]]通常需要大规模长时间模拟,因此亟需开发能够实现稳定[[MD模拟]]的鲁棒性[[MLIP]]。本研究利用自主开发的[[神经网络势能]]([[NNP]])生成器,构建了可在广泛水合水平下对[[全氟离聚物膜]]([[Nafion]])进行大规模长时间[[MD模拟]]的[[NNP模型]]。通过[[主动学习]]循环迭代扩展数据集,我们成功建立了鲁棒的[[深度势能]]([[DP]])模型。具体而言,通过结合非平衡[[DPMD]]模拟采样的非平衡结构,以及在包含最小[[原子间距]]的三维结构特征空间中进行结构筛选,可显著提升[[DP模型]]的鲁棒性。该模型能对约10,000至20,000个原子的大型[[Nafion]]体系进行长达31纳秒的稳定[[MD模拟]]。采用所开发[[DP模型]]的[[MD模拟]]结果表明,与先前小体系[[从头算MD模拟]]相比,[[氢原子]]自[[扩散系数]]在更广泛水合水平范围内与实验值更为吻合。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':多播重装上阵:开放、快速、可靠且高效的日常任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过在多位置复制地址来实现降低[[延迟]]和增强[[韧性]]等目标。鉴于[[任播]]在现代[[互联网]]中的关键作用,先前研究已开发了执行任播普查的工具。首个工具[[iGreedy]]利用地理分散位置的延迟测量来绘制任播部署图;第二个工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查,但存在[[准确性]]和[[精确度]]问题。反之,iGreedy精度极高但速度较慢,且探测成本显著更高。 本文针对这两个系统的缺陷,提出了升级版[[MAnycast Reloaded]]([[MAnycastR]])。以MAnycast2为基础,我们彻底重构了其测量流水线,新增[[分布式探测]]支持、额外[[协议]]([[UDP]]、[[TCP]]和[[IPv6]])支持以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR,与外部任播生产部署进行对比,通过[[RIPE Atlas]]进行广泛延迟测量,并对检测到的60%以上任播前缀进行[[运营商]]数据交叉核验。结果表明MAnycastR实现了高准确性与精确度。我们将持续提供每日MAnycastR普查数据,并以宽松[[开源协议]]发布工具[[源代码]]。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':基于属性图的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':给定图$G$和种子节点$v_s$,[[局部图聚类]](LGC)的目标是在与$C_s$大小近似线性相关的时间内,识别出围绕$v_s$的子图$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图]]的应用场景。然而,现有解决方案大多仅依赖图中节点的[[拓扑连接性]],容易受到现实图数据中普遍存在的缺失或[[噪声链接]]的影响。 为解决这一问题,本文利用[[图拓扑]]与[[节点属性]]的互补特性来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将LGC建模为[[双向扩散分布]](BDD)的估计问题,该模型专门用于捕捉含属性图中节点的[[多跳关联性]]。进一步提出[[LACA]]方法——一种高效且具备强[[局部性]]的LGC解决方案,在多个[[真实数据集]]上表现出卓越性能。其核心组件包括:(i) 基于理论基础的快速[[节点属性预处理]]技术;(ii) 具有严格理论保证和加速[[收敛特性]]的[[自适应向量扩散算法]];(iii) 有效的BDD近似[[三步方案]]。通过在8个[[真实数据集]]上与17种对比方法的实验表明,LACA在[[真实局部簇]]标准下的结果质量优于所有对比方法,同时速度可提升数个数量级。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重构动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成任何社会的结构性支柱。它们通过协调地球上几乎每一个个体,形成了为所有人生产一切的社会[[新陈代谢系统]]。SCN绝非静态存在,而是通过[[企业]]的进出与[[供应关系]]的[[重组]]持续演变。本研究利用独特[[数据集]]追踪了一个国家SCN中企业及其[[供应商]]-[[客户关系]]的时间演化。基于[[匈牙利]]2014至2022年按月申报的[[增值税]]数据,我们重建了包含711,248家企业和38,644,400条连接的[[整体经济网络]],以企业级分辨率覆盖了近乎所有[[经济重构]]事件。研究发现:每年约25%的企业退出SCN,同时28%的新企业加入;平均55%的现存[[供应链接]]会在次年消失;供应链接的[[半衰期]]为13个月。新链接以[[超偏好依附]]方式连接企业,概率满足$p(i)\propto k_i^{1.08}$($k_i$为企业i的供应连接数)。我们校准的简易[[统计网络]]生成模型成功复现了匈牙利主导SCN的典型特征,不仅能重现[[入/出度分布]]、[[同配性]]和[[聚类结构]]等局部[[网络特征]],还能捕捉真实的[[系统性风险]]轮廓。最后探讨了该模型如何通过[[经济重连]]动态来量化[[系统韧性]]及评估[[冲击传导]]。 == 摘要 == * '''原文标题''':The Scalar Size of the Pion from Lattice QCD * '''中文标题''':格点QCD中π介子标量大小的计算 * '''发布日期''':2025-03-26 16:20:11+00:00 * '''作者''':Konstantin Ottnad, Georg von Hippel * '''分类''':hep-lat, hep-ph *'''原文链接''':http://arxiv.org/abs/2503.20687v1 '''中文摘要''':我们提出了一种系统误差完全受控的[[格点QCD]]计算,用于确定[[π介子]]标量形状因子及相关半径。计算结果基于17个规范系综的大规模数据集,这些系综采用$N_f=2+1$[[威尔逊Clover改进海夸克]]配置,涵盖$0.049\mathrm{fm}$至$0.086\mathrm{fm}$四种[[晶格间距]]、$130-350\mathrm{MeV}$的[[π介子]]质量范围及多种物理体积。通过精确计算著名的[[夸克断开贡献]],首次在接近物理[[夸克质量]]的大尺寸精细系综上实现了形状因子的超高动量分辨率。采用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$的宽范围源汇间距,可靠地提取了零动量转移与非零动量转移下的基态矩阵元。这使得我们首次能通过形状因子$Q^2$依赖性的$z$展开参数化(而非小动量转移下的简单线性近似)获得标量半径。物理外推采用三味[[NLO手征微扰理论]],以三个[[低能常数]](包括$L_4^r$的首个[[格点测定值]])参数化[[夸克质量]]依赖性,并通过基于[[赤池信息准则]]的模型平均方法量化基态提取、形状因子参数化及物理外推等系统不确定性。 == 摘要 == * '''原文标题''':Ion beam treatment of thick polystyrene films * '''中文标题''':厚聚苯乙烯薄膜的离子束处理 * '''发布日期''':2025-03-26 09:39:21+00:00 * '''作者''':Alexey Kondyurin * '''分类''':physics.chem-ph *'''原文链接''':http://arxiv.org/abs/2503.20359v1 '''中文摘要''':摘要:在[[硅片]]上旋涂厚度从78[[纳米]]至1.3[[微米]]不等的[[聚苯乙烯]][[薄膜]],采用能量为20 [[keV]]的[[氮]][[离子束]]进行处理。[[椭偏仪]]测量和[[傅里叶变换红外光谱]]显示,表面改性层的深度与离子在[[聚合物]]中的穿透深度(约70纳米)相符。然而,对深层进行清洗及后续测量表明,薄改性层中形成的[[自由基]]会迁移至体层,导致深层聚苯乙烯的[[化学结构]]发生一系列变化。因此,尽管离子在聚苯乙烯薄膜中的穿透深度较浅,但整个薄膜的改性深度远超过离子的[[投影射程]]。由此可见,聚合物离子束处理仅在特定条件下属于表面改性方法,必须考虑自由基反应及其向聚合物深层迁移的可能性。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数极大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':我们研究一维[[高斯分布|高斯]][[位置混合模型|位置混合]]的[[非参数统计|非参数]][[极大似然估计|极大似然估计量]]$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定n个[[数据点]]时,该估计量始终返回最多含n个[[混合分布|分量]]的混合分布;近期(Wu-Polyanskiy, 2020)更对[[次高斯分布|次高斯数据]]给出了尖锐的$O(\log n)$界。本文研究$\widehat{\pi}$的[[计算复杂性|计算特性]]:提出一种[[算法]],当$\varepsilon>0$足够小时,可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算得到$\widehat\pi$的[[Wasserstein距离]]$\varepsilon$-[[近似解]]。其中$K$依赖数据但独立于$\varepsilon$,$C$为[[绝对常数]],$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的[[原子测度|原子数]]。我们还可在有限时间内[[确定性算法|确定性计算]]$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有[[概率密度函数|密度]](相对于[[Lebesgue测度]])的[[概率分布]]独立采样生成时,这些保证几乎必然成立。我们还证明:当$k\leq \sqrt{n}/3$时,限定为k原子分布的$\widehat\pi$[[条件分布]]在相应$2k-1$维[[参数空间]]上存在密度,且[[EM算法]]几乎必然具有[[收敛速度|局部线性收敛性]]。关键工具之一是对[[非退化曲线]]的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子势的大规模长时质子交换膜质子传输原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习原子间势]]([[MLIPs]])作为一种能够实现大规模、长时间[[原子模拟]]并保持与基于[[密度泛函理论]]([[DFT]])和[[从头算波函数理论]]的[[电子结构计算]]相媲美精度的方法,受到广泛关注。然而,基于[[MLIP]]的[[分子动力学]]([[MD]])模拟面临的关键挑战是其稳定性低于传统[[经典势函数]]。分析高度异质体系或[[非晶材料]]通常需要大规模长时间模拟,这要求开发能够实现稳定[[MD模拟]]的鲁棒性[[MLIP]]。本研究利用我们的[[神经网络势]]([[NNP]])生成器,构建了一个能在广泛[[水合]]水平范围内对[[全氟离聚物膜]]([[Nafion]])进行大规模长时间[[MD模拟]]的[[NNP]]模型。通过[[主动学习]]循环迭代扩展[[数据集]],我们成功建立了鲁棒的[[深度势]]([[DP]])模型。具体而言,通过将非平衡[[DPMD]]模拟采样的非平衡结构与融合最小[[原子间距]]的三维[[结构特征空间]]筛选相结合,可显著提升[[DP模型]]的鲁棒性,从而实现对约10,000至20,000[[原子]]的大型[[Nafion]]体系进行长达31[[纳秒]]的稳定[[MD模拟]]。采用所开发[[DP模型]]的[[MD模拟]]获得的[[氢原子]]自[[扩散系数]],在广泛[[水合]]水平范围内比先前小体系[[从头算MD模拟]]结果更接近[[实验值]]。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:开放、快速、可靠且高效的每日任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过将地址复制到多个位置来实现(例如)降低[[延迟]]和增强[[韧性]]。由于任播在现代[[互联网]]中的关键作用,先前研究已开发了执行任播普查的工具。首个工具[[iGreedy]]利用地理分散位置的延迟测量来绘制任播部署图;第二个工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查,但存在[[准确性]]和[[精确性]]问题。相反,iGreedy精度极高但速度较慢,且探测成本更高。 本文针对这两个系统的缺陷,提出了[[MAnycast Reloaded]](MAnycastR)。以MAnycast2为基础,我们彻底重新设计了其测量流程,新增[[分布式探测]]支持、额外[[协议]]([[UDP]]、[[TCP]]和[[IPv6]])支持,以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播[[测试平台]]上验证MAnycastR,与外部任播生产部署对比,并通过[[RIPE Atlas]]进行广泛延迟测量,同时对检测到的60%以上任播[[前缀]]进行[[运营商]]实地验证[[交叉检查]]。结果表明MAnycastR实现了高准确性与精确性。我们将持续提供每日MAnycastR普查数据,并以宽松[[开源协议]]发布工具[[源代码]]。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':属性图上的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':给定图$G$和种子节点$v_s$,[[局部图聚类]](LGC)的目标是在与$C_s$大小大致成线性关系的时间内,识别出围绕$v_s$的子图$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图]]的应用场景。然而现有方案大多仅依赖图中节点的[[拓扑连接性]],容易受到现实图数据中普遍存在的[[缺失]]或[[噪声链接]]的影响。 为解决此问题,本文利用[[图拓扑]]与[[节点属性]]的互补特性来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将LGC建模为[[双向扩散分布]](BDD)的估计问题,该模型专门用于捕捉带属性节点的[[多跳关联性]]。进一步提出[[LACA]]方法——一种高效且具备严格[[理论保证]]的LGC解决方案,在保持强[[局部性]]的同时,在多个[[真实数据集]]上展现出卓越性能。LACA的核心组件包括:(i) 基于[[理论基础]]的快速[[节点属性预处理]]技术;(ii) 具有严格[[理论保证]]且加速[[收敛]]的[[自适应向量扩散算法]];(iii) 高效的[[三步式BDD近似]]方案。通过在8个[[真实数据集]]上与17种[[对比方法]]的实验表明,LACA在[[真实局部簇标准]]下的结果质量优于所有[[对比方法]],同时速度可提升数个[[数量级]]。代码已开源在https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重构动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成任何[[社会]]的[[结构性支柱]]。它们通过协调[[地球]]上几乎每一个[[个体]],形成了为所有人生产一切的[[社会新陈代谢系统]]。SCN绝非[[静态存在]],而是通过[[企业]]的进出和[[供应关系]]的[[重组]]持续[[演变]]。本研究利用独特[[数据集]]追踪了一个[[国家]]SCN中企业及其[[供应商]]-[[客户关系]]的[[时间演化]]。基于[[匈牙利]]2014至2022年每月[[增值税]]数据,我们重建了包含711,248家企业和38,644,400条连接的完整[[经济网络]],以[[企业级分辨率]]捕捉了整个[[经济体]]的几乎每次[[重构事件]]。研究发现:每年约25%的企业退出SCN,同时28%的新企业加入;平均55%的现存供应关系会在次年消失;供应关系的[[半衰期]]为13个月。新连接以[[超偏好依附]]方式链接企业,概率满足$p(i)\propto k_i^{1.08}$($k_i$表示企业$i$的连接数)。我们校准的简单[[统计网络生成模型]]成功复现了匈牙利主导SCN的典型特征,不仅能重现[[入/出度分布]]、[[同配性]]和[[聚类结构]]等[[局部特征]],还能捕捉真实的[[系统性风险]]轮廓。最后探讨了该模型如何通过[[经济重连动态]]来量化[[系统韧性]]和估计[[冲击传导]]。 == 摘要 == * '''原文标题''':Ion beam treatment of thick polystyrene films * '''中文标题''':厚聚苯乙烯薄膜的离子束处理 * '''发布日期''':2025-03-26 09:39:21+00:00 * '''作者''':Alexey Kondyurin * '''分类''':physics.chem-ph *'''原文链接''':http://arxiv.org/abs/2503.20359v1 '''中文摘要''':摘要:在[[硅片]]上旋涂厚度从78[[纳米]]至1.3[[微米]]不等的[[聚苯乙烯]][[薄膜]],采用能量为20 [[keV]]的[[氮]][[离子束]]进行处理。[[椭偏仪]]测量和[[傅里叶变换红外光谱]]显示,表面层的改性对应于离子在[[聚合物]]中的[[穿透深度]](约70纳米)。然而,对深层进行清洗及后续测量表明,在薄改性层中形成的[[自由基]]会迁移至[[本体层]],并导致深层聚苯乙烯[[化学结构]]发生一系列变化。因此,尽管离子在聚苯乙烯薄膜中的穿透深度较小,但整个薄膜的改性深度远大于离子的[[投影射程]]。由此可见,聚合物离子束处理仅在特定条件下属于[[表面改性]]方法,必须考虑自由基反应及其向聚合物深层迁移的可能性。 == 摘要 == * '''原文标题''':The Scalar Size of the Pion from Lattice QCD * '''中文标题''':格点QCD中π介子标量大小的计算 * '''发布日期''':2025-03-26 16:20:11+00:00 * '''作者''':Konstantin Ottnad, Georg von Hippel * '''分类''':hep-lat, hep-ph *'''原文链接''':http://arxiv.org/abs/2503.20687v1 '''中文摘要''':我们提出了一种[[系统误差]]完全受控的[[格点QCD]]计算,用于确定[[π介子]][[标量形状因子]]及相关[[半径]]。计算结果基于17组[[N_f=2+1]][[威尔逊Clover]][[改进海夸克]]的[[规范系综]],这些系综覆盖了从[[a=0.049fm]]到[[a=0.086fm]]四种[[格点间距]]、130-350[[MeV]]的[[π介子质量]]范围以及多种[[物理体积]]。通过对著名的[[夸克断开贡献]]的精确测定,我们首次在[[物理夸克质量]]附近的大尺度精细系综上实现了[[形状因子]]前所未有的[[动量分辨率]]。采用1.0fm≲[[t_sep]]≲3.25fm的大范围[[源汇间距]],可靠地提取了[[零动量转移]]和[[非零动量转移]]下的相关[[基态矩阵元]]。这使得我们首次能够通过所得[[形状因子]][[Q^2依赖性]]的[[z-展开]][[参数化]](而非小动量转移下的简单[[线性近似]])来获取[[标量半径]]。使用三味[[NLO]][[手征微扰理论]]对半径进行[[物理外推]],通过三个[[低能常数]](包括首次格点测定的[[L_4^r]])参数化[[夸克质量依赖性]]。基于[[赤池信息准则]]的[[模型平均]]方法,我们对[[基态提取]]、[[形状因子]][[参数化]]以及[[物理外推]]等环节产生的[[系统误差]]进行了[[量化处理]]。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数最大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':我们研究一维[[高斯分布|高斯]]位置混合的非参数[[极大似然估计]]量$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定n个[[数据点]]时该估计量总是返回最多含n个分量的[[混合分布]],而近期(Wu-Polyanskiy, 2020)对[[亚高斯分布|亚高斯]]数据给出了精确的$O(\log n)$界。本文研究$\widehat{\pi}$的计算特性:我们提出一种[[算法]],当$\varepsilon>0$足够小时,可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算得到$\widehat\pi$的[[Wasserstein距离]]$\varepsilon$-近似解。其中$K$与数据相关但与$\varepsilon$无关,$C$为绝对常数,$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的[[原子数]]。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有[[密度函数]](相对于[[Lebesgue测度]])的[[概率分布]]独立采样生成时,这些保证几乎必然成立。我们还证明:当$k\leq \sqrt{n}/3$时,限定为k原子分布的$\widehat\pi$条件分布在相应$2k-1$维[[参数空间]]上存在密度函数,且[[EM算法]]几乎必然具有局部[[线性收敛]]性。关键工具之一是针对非退化曲线的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习原子间势]]([[MLIPs]])作为一种能够实现大规模、长时间[[原子模拟]]并保持与基于[[密度泛函理论]]([[DFT]])和[[从头算波函数理论]]的[[电子结构计算]]相当精度的方法,受到了广泛关注。然而,基于[[MLIP]]的[[分子动力学]]([[MD]])模拟面临的挑战是其稳定性低于传统[[经典势函数]]。分析高度异质体系或[[非晶材料]]通常需要大规模长时间模拟,因此必须开发能够实现稳定[[MD模拟]]的鲁棒性[[MLIPs]]。本研究利用我们的[[神经网络势]]([[NNP]])生成器,构建了一个能够在广泛[[水合]]水平范围内对[[全氟离聚物膜]]([[Nafion]])进行大规模长时间[[MD模拟]]的[[NNP]]模型。通过[[主动学习]]循环迭代扩展数据集,我们成功建立了鲁棒的[[深度势]]([[DP]])模型。具体而言,通过将非平衡[[DPMD]]模拟采样的非平衡结构与结合最小[[原子间距]]的三维[[结构特征空间]]筛选相结合,可显著提升[[DP模型]]的鲁棒性,从而实现对约10,000至20,000原子的大型[[Nafion]]体系进行长达31纳秒的稳定[[MD模拟]]。采用所开发[[DP模型]]的[[MD模拟]]获得的[[氢原子]]自[[扩散系数]],在广泛[[水合]]水平范围内比先前小体系[[从头算MD模拟]]结果更接近[[实验值]]。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:一个开放、快速、可靠且高效的每日任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过将地址复制到多个位置来实现(例如)降低[[延迟]]和增强[[韧性]]。由于任播在现代[[互联网]]中的关键作用,先前研究已开发了执行任播普查的工具。首个工具[[iGreedy]]利用地理分散位置的延迟测量来映射任播部署;第二个工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查,但存在[[准确性]]和[[精确性]]问题。相反,iGreedy精度极高但速度较慢,且探测成本更高。 本文针对这两个系统的缺陷,提出了[[MAnycast Reloaded]](MAnycastR)。以MAnycast2为基础,我们彻底重新设计了其测量管道,新增[[分布式探测]]支持、额外[[协议]]([[UDP]]、[[TCP]]和[[IPv6]])支持,以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR,与外部任播生产部署对比,并通过[[RIPE Atlas]]进行广泛延迟测量,同时将检测到的60%以上任播前缀与[[运营商]]真实数据交叉核验。结果表明MAnycastR实现了高准确性与精确度。我们以宽松[[开源协议]]向社区提供每日持续的MAnycastR普查数据,并公开该工具的[[源代码]]。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':基于属性图的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':给定[[图]]$G$和种子节点$v_s$,[[局部图聚类]](LGC)的目标是在与$C_s$大小大致成线性关系的时间内,识别出围绕$v_s$的子图$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图]]的[[应用场景]]。然而,现有解决方案大多仅依赖图中节点的[[拓扑连接性]],容易受到现实图数据中普遍存在的[[缺失]]或[[噪声链接]]的影响。 为解决该问题,本文利用[[图拓扑]]与[[节点属性]]的互补特性来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将LGC问题建模为[[双向扩散分布]](BDD)的估计问题,该模型专门用于捕捉含属性图中节点的[[多跳关联性]]。进一步提出[[LACA]]方法——一种高效且具备强[[局部性]]的LGC解决方案,在多个[[真实数据集]]上表现出卓越性能。其核心组件包括:(i)基于理论基础的快速[[节点属性预处理]]技术;(ii)具备严格理论保证和加速收敛特性的[[自适应向量扩散算法]];(iii)高效的[[三步式BDD近似]]方案。通过在8个[[真实数据集]]上与17种对比方法的实验表明,LACA在[[真实局部簇]]的评估指标上全面优于所有对比方法,同时速度提升达数量级。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重构动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成任何[[社会]]的[[结构性支柱]]。它们通过协调[[地球]]上几乎每一个[[个体]],形成了为所有人生产一切的[[社会新陈代谢系统]]。SCN绝非[[静态存在]],而是通过[[企业]]的进出与[[供应关系]]的[[重组]]持续[[演变]]。本研究利用独特[[数据集]]追踪了一个[[国家]]SCN中企业及其供需关系的[[时序演化]]。基于[[匈牙利]]2014至2022年每月[[增值税]]数据,我们重建了包含711,248家企业和38,644,400条连接的[[整体经济网络]],实现了[[企业级分辨率]]的[[经济结构]][[全息记录]]。研究发现:每年约25%企业退出SCN,同时28%新企业进入;平均55%的年度供应关系会在次年消失;供应关系的[[半衰期]]为13个月。新连接以[[超偏好依附]]概率$p(i)\propto k_i^{1.08}$($k_i$为企业i的连接数)形成。我们校准的简易[[统计网络]][[生成模型]]成功复现了匈牙利主导SCN的[[典型特征]],不仅能再现[[入/出度分布]]、[[同配性]]和[[聚类结构]]等[[局部特征]],还能捕捉真实的[[系统性风险]][[轮廓]]。最后探讨了[[经济网络]][[重连动力学]]对量化[[系统韧性]]和估计[[冲击传导]]的[[关键作用]]。 == 摘要 == * '''原文标题''':Ion beam treatment of thick polystyrene films * '''中文标题''':厚聚苯乙烯薄膜的离子束处理 * '''发布日期''':2025-03-26 09:39:21+00:00 * '''作者''':Alexey Kondyurin * '''分类''':physics.chem-ph *'''原文链接''':http://arxiv.org/abs/2503.20359v1 '''中文摘要''':摘要:在[[硅片]]上旋涂厚度为78纳米至1.3微米的不同厚度[[聚苯乙烯]]薄膜,采用能量为20 keV的[[氮离子]]束进行处理。[[椭偏仪]]测量和[[傅里叶变换红外光谱]]显示,表面层的改性对应于离子在[[聚合物]]中的穿透深度(约70纳米)。然而,对深层进行清洗和后续测量表明,在薄改性层中形成的[[自由基]]会迁移到本体层中,并导致深层聚苯乙烯层的化学结构发生一系列变化。因此,尽管离子在聚苯乙烯薄膜中的穿透深度较小,但整个薄膜的改性深度远大于离子的[[投影射程]]。因此,离子束处理聚合物仅在特定条件下可视为表面改性方法。必须考虑自由基反应及其向聚合物深层迁移的可能性。 == 摘要 == * '''原文标题''':The Scalar Size of the Pion from Lattice QCD * '''中文标题''':格点QCD中π介子标量大小的计算 * '''发布日期''':2025-03-26 16:20:11+00:00 * '''作者''':Konstantin Ottnad, Georg von Hippel * '''分类''':hep-lat, hep-ph *'''原文链接''':http://arxiv.org/abs/2503.20687v1 '''中文摘要''':我们提出了一种系统误差完全受控的[[格点QCD]]计算,用于确定[[π介子]]标量形状因子及相关半径。计算结果基于17个[[规范场]]组态的大规模集合,采用$N_f=2+1$ [[Wilson-Clover]]改进[[海夸克]]。这些组态覆盖了从$a=0.049\mathrm{fm}$到$a=0.086\mathrm{fm}$四种[[格距]],$130-350\mathrm{MeV}$的[[π介子质量]]范围以及多种[[物理体积]]。通过对著名的[[夸克不连通贡献]]的精确测定,我们首次在接近物理[[夸克质量]]的大尺寸精细组态上实现了[[形状因子]]前所未有的[[动量分辨率]]。采用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$范围内多种[[源汇间距]],可靠地提取了[[零动量转移]]和[[非零动量转移]]下的[[基态矩阵元]]。这使得我们能够首次通过所得形状因子$Q^2$依赖性的$z$展开参数化(而非小动量转移下的简单线性近似)获取[[标量半径]]。半径的物理外推采用三味[[NLO手征微扰理论]],以三个[[低能常数]](包括$L_4^r$的首次[[格点测定]]结果)参数化[[夸克质量依赖性]]。通过基于[[赤池信息准则]]的[[模型平均]]方法,系统评估了[[基态提取]]、形状因子参数化以及物理外推对最终结果的[[系统不确定性]]。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数极大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':我们研究一维[[高斯分布|高斯]]位置混合的[[非参数统计|非参数]][[最大似然估计]]量$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定n个[[数据点]],该估计量总是返回最多含n个分量的[[混合分布]];近期(Wu-Polyanskiy, 2020)对[[次高斯分布|次高斯]]数据给出了精确的$O(\log n)$界。本文研究$\widehat{\pi}$的计算特性:我们提出一种[[算法]],当$\varepsilon>0$足够小时,可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算[[Wasserstein距离]]下的$\varepsilon$[[近似解]],其中$K$与数据相关但与$\varepsilon$无关,$C$为绝对常数,$k=|supp(\widehat{\pi})|\leq n$是$\widehat\pi$的[[原子数]]。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$来自具有[[概率密度函数|密度]](相对于[[Lebesgue测度]])的[[概率分布]]时,这些保证几乎必然成立。我们还证明:当$k\leq \sqrt{n}/3$时,限定为k原子分布的$\widehat\pi$在相关$2k-1$维[[参数空间]]上具有密度,且[[EM算法]]几乎必然局部[[线性收敛]]。关键工具之一是[[非退化]]曲线的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子间势的聚合物电解质膜质子传输大规模长时原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习原子间势]]([[MLIPs]])作为一种能够实现大规模、长时间[[原子模拟]]的方法备受关注,同时保持与基于[[密度泛函理论]]([[DFT]])和[[从头算波函数理论]]的[[电子结构计算]]相当的精度。然而,基于[[MLIP]]的[[分子动力学]]([[MD]])模拟面临的挑战是其稳定性低于使用传统[[经典势]]的模拟。分析高度异质系统或[[无定形材料]]通常需要大规模和长时间的模拟,因此需要开发能够进行稳定[[MD模拟]]的鲁棒[[MLIPs]]。在本研究中,我们利用[[神经网络势]]([[NNP]])生成器,构建了一个[[NNP模型]],能够在广泛水合水平范围内对[[全氟离子交换膜]]([[Nafion]])进行大规模、长时间的[[MD模拟]]。通过[[主动学习]]循环迭代扩展数据集,我们成功构建了一个鲁棒的[[深度势]]([[DP]])模型。具体而言,通过结合非平衡[[DPMD]]模拟采样的非平衡结构与包含最小原子间距离的[[3D结构特征空间]]中的结构筛选,可以显著增强[[DP模型]]的鲁棒性,从而实现对大约10,000至20,000个原子的大型[[Nafion系统]]进行长达31 ns的稳定[[MD模拟]]。采用所开发[[DP模型]]的[[MD模拟]]得到的[[氢原子]]自[[扩散系数]],在广泛水合水平范围内与实验值更为接近,优于先前对小系统进行的[[从头算MD模拟]]结果。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:一个开放、快速、可靠且高效的每日任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过将地址复制到多个位置来实现降低[[延迟]]和增强[[韧性]]等目标。由于任播在现代[[互联网]]中的关键作用,先前研究已开发了多种任播普查工具。首款工具[[iGreedy]]通过地理分散位置的延迟测量来绘制任播部署图;第二款工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度,可在3小时内完成全网普查,但存在[[准确性]]和[[精确度]]问题。相反,iGreedy精度极高但速度较慢,且探测成本更高。 本文针对这两个系统的缺陷提出了[[MAnycast Reloaded]](MAnycastR)。以MAnycast2为基础,我们彻底重构了其测量流程,新增[[分布式探测]]支持、额外[[协议]]([[UDP]]、[[TCP]]和[[IPv6]])支持以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR,与外部任播生产部署进行对比,并通过[[RIPE Atlas]]进行广泛延迟测量,同时针对60%以上检测到的任播前缀与运营商真实数据进行交叉验证。结果表明MAnycastR实现了高准确性和精确度。我们将持续提供每日MAnycastR普查数据,并以宽松[[开源协议]]发布工具[[源代码]]。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':基于属性图的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':摘要:给定[[图]]$G$和种子节点$v_s$,[[局部图聚类]](LGC)的目标是在与$C_s$大小大致成线性关系的时间内,识别出围绕$v_s$的子图$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图]]的应用场景。然而,现有解决方案大多仅依赖图中节点的[[拓扑连接性]],容易受到现实图数据中普遍存在的[[缺失]]或[[噪声链接]]的影响。为解决该问题,本文利用[[图拓扑]]与[[节点属性]]的互补特性来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将LGC建模为[[双向扩散分布]](BDD)的估计问题,该模型专门用于捕捉带属性节点的[[多跳关联性]]。进一步提出[[LACA]]方法——一种高效且具备严格[[理论保证]]的LGC算法,其核心包括:(i) 基于[[理论基础]]的快速节点属性[[预处理技术]],(ii) 具有[[自适应扩散]]能力且保证[[加速收敛]]的[[向量传播]]算法,(iii) 高效的[[三步式]]BDD近似方案。在8个[[真实数据集]]上与17种[[对比方法]]的实验表明,LACA在[[真实局部簇]]的[[评估指标]]上全面优于所有[[基线方法]],同时实现[[数量级]]的[[速度提升]]。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重构动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成任何[[社会]]的[[结构性支柱]]。它们通过协调[[地球]]上几乎每一个[[个体]],形成了为所有人生产一切的[[社会新陈代谢系统]]。[[供应链网络]]绝非静态,而是通过[[企业]]的进出和[[供应关系]]的[[重组]]不断变化。本文利用独特[[数据集]]研究了一个[[国家]][[供应链网络]]中[[企业]]及其[[供应商]]-[[买方]][[关系]]的[[时间演化]]。基于[[匈牙利]]2014至2022年每月申报的[[增值税]]数据,我们重建了包含711,248家[[企业]]和38,644,400条[[连接]]的[[整体经济网络]],以[[企业级分辨率]]覆盖了几乎所有的[[经济重构事件]]。研究发现:每年约25%的[[企业]]退出[[供应链网络]],同时28%的[[新企业]]加入;平均55%的现存[[供应链接]]会在次年消失;[[供应链接]]的[[半衰期]]为13个月。[[新链接]]以[[超偏好依附]]方式连接[[企业]],概率满足$p(i)\propto k_i^{1.08}$($k_i$表示[[企业]]$i$的[[供应连接]]数)。我们校准了一个能复现[[匈牙利]]主导[[供应链网络]]典型特征的简单[[统计网络生成模型]],该模型不仅复现了[[入/出度分布]]、[[同配性]]和[[聚类结构]]等[[局部网络特征]],还捕捉了真实的[[系统性风险]]特征。最后讨论了该模型如何通过[[经济网络]]的[[重连动态]]来量化其[[韧性]]并评估[[冲击传播]]。 == 摘要 == * '''原文标题''':Ion beam treatment of thick polystyrene films * '''中文标题''':厚聚苯乙烯薄膜的离子束处理 * '''发布日期''':2025-03-26 09:39:21+00:00 * '''作者''':Alexey Kondyurin * '''分类''':physics.chem-ph *'''原文链接''':http://arxiv.org/abs/2503.20359v1 '''中文摘要''':摘要:在[[硅片]]上旋涂厚度为78纳米至1.3微米的不同厚度[[聚苯乙烯]]薄膜,并用能量为20 keV的[[氮离子]]进行处理。[[椭圆偏振测量]]和[[傅里叶变换红外光谱]]显示,表面层的改性对应于离子在[[聚合物]]中的[[穿透深度]](约70纳米)。然而,对深层进行清洗和后续测量表明,在薄改性层中形成的[[自由基]]迁移到体层中,并引起深层聚苯乙烯[[化学结构]]的多种变化。因此,尽管离子在聚苯乙烯薄膜中的穿透深度较小,但整个薄膜的改性深度远大于离子的[[投影射程]]。因此,[[离子束]]处理聚合物仅在特定条件下是一种[[表面改性]]方法。必须考虑[[自由基反应]]及其向聚合物深层迁移的可能性。 == 摘要 == * '''原文标题''':The Scalar Size of the Pion from Lattice QCD * '''中文标题''':格点QCD中π介子的标量大小 * '''发布日期''':2025-03-26 16:20:11+00:00 * '''作者''':Konstantin Ottnad, Georg von Hippel * '''分类''':hep-lat, hep-ph *'''原文链接''':http://arxiv.org/abs/2503.20687v1 '''中文摘要''':我们提出了一种[[系统误差]]完全受控的[[格点QCD]]计算,用于确定[[π介子]]标量[[形状因子]]及相关[[半径]]。计算结果基于17个[[规范系综]]的大规模数据集,这些系综采用$N_f=2+1$ [[Wilson Clover]]改进的[[海夸克]]配置。这些系综覆盖了从$a=0.049\mathrm{fm}$到$a=0.086\mathrm{fm}$的四种[[格点间距]]、$130-350\mathrm{MeV}$的[[π介子质量]]范围以及多种[[物理体积]]。通过精确计算著名的[[夸克断开贡献]],我们首次在接近[[物理夸克质量]]的大尺寸精细系综上实现了形状因子前所未有的[[动量分辨率]]。采用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$的宽范围[[源汇分离距离]],可靠地提取了[[零动量转移]]和[[非零动量转移]]下的[[基态矩阵元]]。这使得我们能够首次通过所得形状因子$Q^2$依赖性的[[$z$展开]]参数化(而非小动量转移下的简单[[线性近似]])获得[[标量半径]]。半径的[[物理外推]]采用三味[[NLO手征微扰理论]],以三个[[低能常数]](包括$L_4^r$的首个[[格点测定值]])参数化[[夸克质量依赖性]]。通过基于[[赤池信息准则]]的[[模型平均]]方法,系统评估了[[基态提取]]、形状因子参数化以及物理外推对最终结果的[[系统不确定性]]影响。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数最大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':我们研究一维[[高斯分布|高斯]][[位置混合模型]]的[[非参数统计|非参数]][[极大似然估计]]量$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定包含$n$个[[数据点]]的[[数据集]],该估计量总是返回最多包含$n$个分量的[[混合模型]];而近期(Wu-Polyanskiy, 2020)对[[次高斯分布|次高斯]]数据给出了严格的$O(\log n)$界。本文重点研究$\widehat{\pi}$的[[计算复杂性|计算特性]]:我们提出一种[[算法]],当$\varepsilon>0$足够小时,可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算出[[Wasserstein距离]]意义上的$\varepsilon$[[近似解]]$\widehat\pi$。其中$K$与数据相关但与$\varepsilon$无关,$C$为[[绝对常数]],$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的[[原子数量]]。我们还可在有限时间内[[确定性算法|确定性计算]]$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$中的点独立采样自具有(相对于[[勒贝格测度]]的)[[密度函数]]的[[概率分布]]时,这些保证几乎必然成立。我们还证明:当$k\leq \sqrt{n}/3$时,限定为$k$原子结构的$\widehat\pi$[[条件分布]]在相关$2k-1$维[[参数空间]]上具有密度函数,且[[EM算法]]几乎必然具有[[局部收敛性|局部线性收敛性]]。其中关键工具是[[非退化曲线]]的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习原子间势]]([[MLIP]]s)作为一种能够实现大规模、长时间[[原子模拟]]的方法受到广泛关注,其精度可与基于[[密度泛函理论]]([[DFT]])和[[从头算波函数理论]]的[[电子结构计算]]相媲美。然而,基于[[MLIP]]的[[分子动力学]]([[MD]])模拟存在稳定性低于传统[[经典势函数]]的挑战。分析高度异质体系或[[非晶材料]]通常需要大规模长时间模拟,因此必须开发能够实现稳定[[MD]]模拟的[[鲁棒性]][[MLIP]]。本研究利用我们的[[神经网络势]]([[NNP]])生成器,构建了一个[[NNP]]模型,可在广泛[[水合]]水平范围内对[[全氟离聚物膜]]([[Nafion]])进行大规模长时间[[MD]]模拟。通过[[主动学习]]循环迭代扩展[[数据集]],我们成功建立了鲁棒的[[深度势]]([[DP]])模型。具体而言,通过将[[非平衡]][[DPMD]]模拟采样的[[非平衡结构]]与结合[[最小原子间距]]的[[三维结构特征空间]]筛选相结合,可显著增强[[DP]]模型的[[鲁棒性]],从而实现对约10,000至20,000[[原子]]的大型[[Nafion]]体系进行长达31 [[ns]]的稳定[[MD]]模拟。采用所开发[[DP]]模型的[[MD]]模拟获得的[[氢原子]][[自扩散系数]],在广泛[[水合]]水平范围内比先前小体系[[从头算]][[MD]]模拟结果更接近[[实验值]]。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:开放、快速、可靠且高效的每日任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过将地址复制到多个位置来实现降低[[延迟]]和增强[[韧性]]等目标。由于[[任播]]在现代[[互联网]]中的关键作用,先前研究已开发了多种任播普查工具。首款工具[[iGreedy]]通过地理分散节点的延迟测量来绘制任播部署图;第二款工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查,但存在[[准确性]]和[[精确度]]问题;而iGreedy虽然高度准确,但速度较慢且探测成本更高。 本文针对这两个系统的缺陷提出了[[MAnycast Reloaded]]([[MAnycastR]])。我们在MAnycast2基础上完全重构了其测量管道,新增[[分布式探测]]支持、额外[[协议]]([[UDP]]、[[TCP]]和[[IPv6]])支持以及类似iGreedy的延迟测量功能。通过在含32个全球分布式节点的任播测试平台进行验证,与外部任播生产部署对比,结合[[RIPE Atlas]]的广泛延迟测量,并对检测到的60%以上任播前缀进行[[运营商]]数据交叉核验,证明MAnycastR具备高准确性和精确度。我们将持续提供每日MAnycastR普查数据,并以宽松[[开源协议]]发布工具[[源代码]]。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':基于属性图的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':给定[[图]]$G$和种子节点$v_s$,[[局部图聚类]](LGC)的目标是在与$C_s$大小大致成线性关系的时间内,识别出围绕$v_s$的子图$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图]]的应用场景。然而,现有解决方案大多仅依赖图中节点的[[拓扑连接性]],容易受到现实图数据中普遍存在的[[缺失链接]]或[[噪声链接]]的影响。 为解决这一问题,本文利用[[图拓扑]]与[[节点属性]]的互补特性来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将LGC建模为[[双向扩散分布]](BDD)的估计问题,该模型专门用于捕捉带属性节点的[[多跳关联性]]。进一步提出[[LACA]]方法——一种高效且具备强[[局部性]]的LGC解决方案,在多个[[真实数据集]]上表现出卓越性能。其核心组件包括:(i) 基于理论基础的快速[[节点属性预处理]]技术;(ii) 具有严格理论保证和加速[[收敛特性]]的[[自适应向量扩散算法]];(iii) 高效的[[三步式BDD近似]]方案。通过在8个[[真实数据集]]上与17种对比方法的实验表明,LACA在[[真实局部簇]]的评估指标上全面优于所有对比方法,同时速度提升可达[[数量级]]。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重构动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成任何[[社会]]的[[结构性支柱]]。它们通过协调[[地球]]上几乎每一个[[个体]],形成了为所有人生产一切的[[社会新陈代谢系统]]。供应链网络绝非[[静态存在]],而是通过[[企业]]的进出和[[供应关系]]的[[重组]]不断变化。本文利用独特[[数据集]]研究了一个[[国家]]供应链网络中企业及其[[供应商-客户关系]]的[[时间演化]]。基于[[匈牙利]]2014至2022年每月报告的[[增值税]]数据,我们重建了包含711,248家企业和38,644,400条连接的[[整体经济网络]],以[[企业级分辨率]]覆盖了几乎整个[[经济体]]的所有[[重构事件]]。研究发现:每年约25%的企业退出供应链网络,同时28%的[[新企业]]加入;平均而言,当年存在的[[供应链接]]中有55%会在次年消失;供应链接的[[半衰期]]为13个月。新链接以[[超偏好依附]]概率$p(i)\propto k_i^{1.08}$($k_i$表示企业i的[[供应连接数]])附着于企业。我们校准了一个能复现匈牙利主导供应链网络典型特征的简单[[统计网络生成模型]],该模型不仅复现了[[入/出度分布]]、[[同配性]]和[[聚类结构]]等[[局部网络特征]],还捕捉了真实的[[系统性风险]]特征。最后讨论了当前模型如何通过[[经济重连动态]]来量化其[[韧性]]并估计[[冲击传导]]。 == 摘要 == * '''原文标题''':Ion beam treatment of thick polystyrene films * '''中文标题''':厚聚苯乙烯薄膜的离子束处理 * '''发布日期''':2025-03-26 09:39:21+00:00 * '''作者''':Alexey Kondyurin * '''分类''':physics.chem-ph *'''原文链接''':http://arxiv.org/abs/2503.20359v1 '''中文摘要''':摘要:在[[硅片]]上旋涂厚度从78[[纳米]]至1.3[[微米]]不等的[[聚苯乙烯]][[薄膜]],经20 [[keV]][[氮]][[离子束]]处理后,[[椭偏仪]]测量和[[傅里叶变换红外光谱]]显示表面改性层深度与离子在[[聚合物]]中的[[穿透深度]](约70纳米)相符。然而,深层洗涤及后续测试表明,薄改性层中形成的[[自由基]]会迁移至[[本体层]],导致深层聚苯乙烯发生一系列[[化学结构]]变化。因此,尽管离子在聚苯乙烯薄膜中的穿透深度有限,整个薄膜的[[改性深度]]却远超过[[离子投影射程]]。这表明离子束处理仅能有条件地视为[[表面改性]]方法,必须考虑自由基反应及其向聚合物深层迁移的可能性。 == 摘要 == * '''原文标题''':The Scalar Size of the Pion from Lattice QCD * '''中文标题''':格点QCD中π介子的标量大小 * '''发布日期''':2025-03-26 16:20:11+00:00 * '''作者''':Konstantin Ottnad, Georg von Hippel * '''分类''':hep-lat, hep-ph *'''原文链接''':http://arxiv.org/abs/2503.20687v1 '''中文摘要''':我们提出了一种系统误差完全受控的[[格点QCD]]计算,用于确定[[π介子]]标量形状因子及相关半径。计算结果基于17组[[Nf=2+1]][[威尔逊-克拉夫改进海夸克]]的规范系综,涵盖0.049-0.086fm四种[[晶格间距]]、130-350MeV[[π介子]]质量范围及多种物理体积。通过对著名[[夸克断开贡献]]的精确测定,首次在接近物理[[夸克质量]]的大尺寸精细系综上实现了形状因子前所未有的[[动量分辨率]]。采用1.0-3.25fm宽范围的源汇分离距离,可靠地提取了零[[动量转移]]与非零[[动量转移]]下的基态矩阵元。这使得我们首次能通过所得形状因子[[Q²依赖性]]的[[z-展开]]参数化(而非小[[动量转移]]下的简单线性近似)获取标量半径。使用三味[[NLO]][[手征微扰理论]]对半径进行物理外推,以三个[[低能常数]](包括[[L₄ʳ]]的首个[[格点测定]]值)参数化[[夸克质量]]依赖性。通过基于[[赤池信息准则]]的模型平均,量化了基态提取、形状因子参数化及物理外推等环节对最终结果的系统不确定性。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数极大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':摘要:我们研究一维[[高斯分布|高斯]]位置混合的[[非参数统计|非参数]][[最大似然估计|最大似然估计量]]$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定n个[[数据点]],该估计量总是返回最多含n个分量的[[混合分布]],而近期(Wu-Polyanskiy, 2020)对[[次高斯分布|次高斯数据]]给出了严格的$O(\log n)$界。本文研究$\widehat{\pi}$的计算特性:提出一种[[算法]],当$\varepsilon>0$足够小时,可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算[[Wasserstein距离]]下的$\varepsilon$[[近似解]],其中$K$依赖数据但独立于$\varepsilon$,$C$为绝对常数,$k=|supp(\widehat{\pi})|\leq n$是$\widehat\pi$的[[原子数]]。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$来自具有[[概率密度函数|密度]](相对于[[Lebesgue测度]])的[[概率分布]]时,这些保证几乎必然成立。我们还证明:当$k\leq \sqrt{n}/3$时,限定为k原子分布的$\widehat\pi$在相关$2k-1$维[[参数空间]]上具有密度,且[[EM算法]]几乎必然[[局部收敛|局部线性收敛]]。关键工具之一是[[非退化曲线]]的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习原子间势]]([[MLIPs]])作为一种能够实现大规模、长时间[[原子尺度模拟]]的方法,同时保持与基于[[密度泛函理论]]([[DFT]])和[[从头算波函数理论]]的[[电子结构计算]]相当的精度,引起了广泛关注。然而,基于[[MLIP]]的[[分子动力学]]([[MD]])模拟面临的挑战是其稳定性低于使用传统[[经典势]]的模拟。分析高度异质体系或[[非晶材料]]通常需要大规模和长时间的模拟,因此必须开发能够进行稳定[[MD模拟]]的鲁棒[[MLIP]]。在本研究中,我们利用自研的[[神经网络势]]([[NNP]])生成器,构建了一个[[NNP模型]],能够对[[全氟离聚物膜]]([[Nafion]])在不同[[水合水平]]下进行大规模、长时间的[[MD模拟]]。通过[[主动学习]]循环迭代扩展数据集,我们成功建立了鲁棒的[[深度势]]([[DP]])模型。具体而言,通过将[[非平衡]][[DPMD模拟]]采样的[[非平衡结构]]与结合[[最小原子间距]]的[[三维结构特征空间]]中的[[结构筛选]]相结合,可显著提升[[DP模型]]的鲁棒性,从而实现对约10,000至20,000个[[原子]]的大型[[Nafion体系]]进行长达31 ns的稳定[[MD模拟]]。采用所开发[[DP模型]]的[[MD模拟]]获得的[[氢原子]][[自扩散系数]],在广泛[[水合水平]]范围内比先前小体系[[从头算MD模拟]]结果更接近[[实验值]]。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:开放、快速、可靠且高效的每日任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过将地址复制到多个位置来实现降低[[延迟]]和增强[[韧性]]等目标。由于[[任播]]在现代[[互联网]]中的关键作用,先前研究已开发了执行任播普查的工具。首个工具[[iGreedy]]利用地理分散位置的延迟测量来绘制任播部署图;第二个工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查,但存在[[准确性]]和[[精确度]]问题。相反,iGreedy精度极高但速度较慢,且探测成本更高。 本文针对这两个系统的缺陷提出了[[MAnycast Reloaded]](MAnycastR)。以MAnycast2为基础,我们彻底重新设计了其测量流水线,新增[[分布式探测]]支持、额外[[协议]]([[UDP]]、[[TCP]]和[[IPv6]])支持以及类似iGreedy的延迟测量功能。我们在包含32个全球分布式节点的任播测试平台上验证MAnycastR,与外部任播生产部署进行对比,并通过[[RIPE Atlas]]进行广泛延迟测量,同时对检测到的60%以上任播前缀与运营商真实数据进行[[交叉验证]]。结果表明MAnycastR实现了高准确性和精确度。我们以宽松的[[开源许可]]向社区提供每日持续的MAnycastR普查数据,并发布该工具的[[源代码]]。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':基于属性图的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':摘要:给定[[图]]$G$和[[种子节点]]$v_s$,[[局部图聚类]]([[LGC]])的目标是在与$C_s$大小大致成线性关系的时间内,识别出围绕$v_s$的[[子图]]$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图]]的[[应用场景]]。然而,现有解决方案大多仅依赖图中节点的[[拓扑连接性]],容易受到现实[[图数据]]中普遍存在的[[缺失]]或[[噪声链接]]的影响。为解决该问题,本文利用[[图拓扑]]与[[节点属性]]的[[互补特性]]来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将[[LGC]]建模为[[双向扩散分布]]([[BDD]])的估计问题,该模型专门用于捕捉带[[属性节点]]的[[多跳关联性]]。进一步提出[[LACA]]方法——一种高效且具备严格[[理论保证]]的[[LGC]][[算法]],其核心包括:(i) 快速且[[理论完备]]的[[节点属性]][[预处理技术]];(ii) 具有[[自适应扩散]]能力和[[加速收敛]]特性的[[向量传播]][[算法]];(iii) 高效的[[三步式]][[BDD]][[近似方案]]。在8个[[真实数据集]]上与17种[[基线方法]]的对比实验表明,[[LACA]]在真实[[局部簇]]的[[评估指标]]上全面优于所有对比方法,同时[[速度提升]]达[[数量级]]。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重连动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成了任何[[社会]]的[[结构性支柱]]。它们通过协调[[地球]]上几乎每一个[[个体]],形成了为所有人生产一切的[[社会新陈代谢系统]]。供应链网络绝非[[静态存在]],而是通过[[企业]]的进出和[[供应关系]]的[[重组]]不断变化。本研究利用独特[[数据集]]追踪了一个[[国家]]供应链网络中企业及其[[供应商-客户关系]]的[[时间演化]]。基于[[匈牙利]]2014至2022年每月报告的[[增值税]]数据,我们重建了包含711,248家企业和38,644,400条连接的[[整体经济网络]],以[[企业级分辨率]]覆盖了几乎整个[[经济体]]的所有[[重构事件]]。研究发现:每年约25%的企业退出供应链网络,同时28%的[[新企业]]加入;平均55%的现存[[供应链接]]会在次年消失;供应链接的[[半衰期]]为13个月。新链接以[[超偏好依附]]概率$p(i)\propto k_i^{1.08}$($k_i$表示企业i的[[供应连接数]])附着于企业。我们校准了一个能复现匈牙利主导供应链网络典型特征的简单[[统计网络生成模型]],该模型不仅复现了[[入/出度分布]]、[[同配性]]和[[聚类结构]]等[[局部网络特征]],还捕捉了真实的[[系统性风险]]特征。最后讨论了当前模型如何通过[[经济重连动态]]来量化[[系统韧性]]和估计[[冲击传导]]。 == 摘要 == * '''原文标题''':Ion beam treatment of thick polystyrene films * '''中文标题''':厚聚苯乙烯薄膜的离子束处理 * '''发布日期''':2025-03-26 09:39:21+00:00 * '''作者''':Alexey Kondyurin * '''分类''':physics.chem-ph *'''原文链接''':http://arxiv.org/abs/2503.20359v1 '''中文摘要''':摘要:在[[硅片]]上旋涂厚度为78纳米至1.3微米的不同厚度[[聚苯乙烯]]薄膜,并用能量为20 keV的[[氮离子]]进行处理。[[椭偏仪]]测量和[[傅里叶变换红外光谱]]显示,表面层的改性对应于离子在[[聚合物]]中的[[穿透深度]](约70纳米)。然而,对深层进行清洗和后续测量表明,在薄改性层中形成的[[自由基]]会迁移到[[本体层]]中,并引起深层[[聚苯乙烯]]层[[化学结构]]的多种变化。因此,尽管离子在[[聚苯乙烯]]薄膜中的[[穿透深度]]较小,但整个薄膜的[[改性深度]]远大于离子的[[投影射程]]。因此,[[离子束]]处理[[聚合物]]仅在特定条件下是一种[[表面改性]]方法。必须考虑[[自由基反应]]及其向[[聚合物]]深层迁移的可能性。 == 摘要 == * '''原文标题''':The Scalar Size of the Pion from Lattice QCD * '''中文标题''':格点QCD中π介子的标量大小 * '''发布日期''':2025-03-26 16:20:11+00:00 * '''作者''':Konstantin Ottnad, Georg von Hippel * '''分类''':hep-lat, hep-ph *'''原文链接''':http://arxiv.org/abs/2503.20687v1 '''中文摘要''':我们提出了一种[[系统误差]]完全受控的[[格点QCD]]计算,用于确定[[π介子]][[标量形状因子]]及相关[[半径]]。计算结果基于包含17个[[规范系综]]的大规模数据集,这些系综采用$N_f=2+1$[[威尔逊Clover改进海夸克]]。所涉系综覆盖$0.049\mathrm{fm}$至$0.086\mathrm{fm}$四种[[格距]]、$130-350\mathrm{MeV}$的[[π介子质量]]范围及多种[[物理体积]]。通过精确计算著名的[[夸克断开贡献]],首次在接近[[物理夸克质量]]的大尺寸精细系综上实现了形状因子前所未有的[[动量分辨率]]。采用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$的大范围[[源汇间距]],可靠地提取了[[零动量转移]]与[[非零动量转移]]下的[[基态矩阵元]]。这使得我们首次能通过所得形状因子$Q^2$依赖性的$z$[[展开参数化]](而非小动量转移下的简单[[线性近似]])获取[[标量半径]]。半径的[[物理外推]]采用三味[[NLO手征微扰理论]],以三个[[低能常数]](包括$L_4^r$的首个[[格点测定值]])参数化[[夸克质量依赖性]]。通过基于[[赤池信息准则]]的[[模型平均方法]],系统评估了[[基态提取]]、形状因子参数化及物理外推等环节对最终结果的[[系统不确定性]]。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数最大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':我们研究一维[[高斯分布|高斯]][[位置混合]]的[[非参数统计|非参数]][[极大似然估计]]量$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定n个[[数据点]]时,该估计量始终返回最多含n个分量的[[混合分布]];近期(Wu-Polyanskiy, 2020)更对[[次高斯分布|次高斯]]数据给出了严格的$O(\log n)$界。本文重点研究$\widehat{\pi}$的[[计算复杂性|计算特性]]:我们提出一种[[算法]],当$\varepsilon>0$足够小时,可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算出[[Wasserstein距离]]意义上的$\varepsilon$[[近似解]],其中$K$与数据相关但与$\varepsilon$无关,$C$为[[绝对常数]],$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的[[原子测度|原子数]]。我们还可在有限时间内确定性计算出$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$中的点独立采样自具有[[Lebesgue测度]][[概率密度函数|密度]]的[[概率分布]]时,这些保证几乎必然成立。我们进一步证明:当$k\leq \sqrt{n}/3$时,限定为k原子分布的$\widehat\pi$[[条件分布]]在相应$2k-1$维[[参数空间]]上存在密度,且[[EM算法]]几乎必然具有[[局部收敛性|局部线性收敛性]]。关键工具之一是对[[非退化曲线]]的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子势的大规模长时质子交换膜质子传输原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习原子间势]]([[MLIPs]])作为一种能够实现大规模、长时间[[原子尺度模拟]]的方法,同时保持与基于[[密度泛函理论]]([[DFT]])和[[从头算波函数理论]]的[[电子结构计算]]相当的精度,引起了广泛关注。然而,基于[[MLIP]]的[[分子动力学]]([[MD]])模拟面临的挑战是其稳定性低于使用传统[[经典势]]的模拟。分析高度异质体系或[[非晶材料]]通常需要大规模和长时间的模拟,因此需要开发能够实现稳定[[MD模拟]]的鲁棒[[MLIP]]。在本研究中,我们利用自研的[[神经网络势]]([[NNP]])生成器,构建了一个[[NNP模型]],该模型能够对[[全氟磺酸离子膜]]([[Nafion]])在不同[[水合水平]]下进行大规模、长时间的[[MD模拟]]。通过[[主动学习]]循环迭代扩展数据集,我们成功建立了鲁棒的[[深度势]]([[DP]])模型。具体而言,通过将非平衡[[DPMD]]模拟采样的非平衡结构与结合最小[[原子间距]]的三维[[结构特征空间]]中的结构筛选相结合,可显著提升[[DP模型]]的鲁棒性,从而实现对约10,000至20,000个原子的大型[[Nafion]]体系进行长达31 ns的稳定[[MD模拟]]。采用所开发[[DP模型]]的[[MD模拟]]获得的[[氢原子]]自[[扩散系数]],在广泛[[水合水平]]范围内比先前小体系[[从头算MD模拟]]结果更接近[[实验值]]。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:开放、快速、可靠且高效的每日任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过将地址复制到多个位置来实现(例如)降低[[延迟]]和增强[[韧性]]。由于任播在现代[[互联网]]中的关键作用,先前研究已开发了执行任播普查的工具。首个工具[[iGreedy]]利用地理分散位置的延迟测量来映射任播部署;第二个工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查,但存在准确性和精确性问题。相反,iGreedy精度极高但速度较慢,且探测成本更高。 本文针对这两个系统的缺陷,提出了[[MAnycast Reloaded]]([[MAnycastR]])。我们以MAnycast2为基础,彻底重构其测量流程,新增分布式探测支持、额外协议([[UDP]]、[[TCP]]和[[IPv6]])支持,以及类似iGreedy的延迟测量功能。通过在含32个全球分布式节点的任播测试床上验证MAnycastR,与外部任播生产部署对比,结合[[RIPE Atlas]]的广泛延迟测量,并对检测到的任播前缀中超过60%进行运营商真实数据交叉验证,结果表明MAnycastR实现了高准确性与精确度。我们将持续提供每日MAnycastR普查数据,并以宽松[[开源协议]]发布工具[[源代码]]。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':基于属性图的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':摘要:给定[[图]]$G$和[[种子节点]]$v_s$,[[局部图聚类]]([[LGC]])的目标是在与$C_s$大小近似线性相关的时间内,识别出围绕$v_s$的[[子图]]$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图]]的[[应用场景]]。然而现有方案大多仅依赖图中节点的[[拓扑连接性]],容易受到现实[[图谱]]中普遍存在的[[缺失链接]]或[[噪声链接]]的影响。为解决该问题,本文利用[[图拓扑]]与[[节点属性]]的[[互补特性]]来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将[[LGC]]建模为[[双向扩散分布]]([[BDD]])的估计问题,该模型专门用于捕捉含属性节点间的[[多跳亲和力]]。进一步提出[[LACA]]方法——一种高效且具备严格[[理论保证]]的[[LGC]]方案,其核心组件包括:(i) 基于[[理论基础]]的快速[[节点属性预处理]]技术;(ii) 具有[[理论保证]]和[[加速收敛]]特性的[[自适应向量扩散算法]];(iii) 高效的[[三步式BDD近似]]方案。在8个[[真实数据集]]上与17种[[对比方法]]的实验表明,[[LACA]]在[[真实局部簇]]的衡量标准下均优于所有[[对比方法]],同时[[速度提升]]达[[数量级]]。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重连动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成了任何[[社会]]的[[结构性支柱]]。它们通过协调[[地球]]上几乎每一个[[个体]],形成了为所有人生产一切的[[社会新陈代谢系统]]。供应链网络绝非[[静态存在]],而是通过[[企业]]的[[进入退出]]与[[供应关系]]的[[重组]]持续[[演变]]。本研究利用独特[[数据集]]追踪了一个[[国家]]供应链网络中企业及其[[供应商-客户关系]]的[[时间演化]]。基于[[匈牙利]]2014至2022年按月申报的[[增值税]]数据,我们重建了包含711,248家企业和38,644,400条连接的[[整体经济网络]],以[[企业级分辨率]]覆盖了几乎所有的[[经济结构调整]]事件。研究发现:每年约25%的企业退出供应链网络,同时28%的[[新企业]]加入;平均而言,当年存在的[[供应链接]]中有55%会在次年消失;供应链接的[[半衰期]]为13个月。新链接以[[超偏好依附]]方式连接企业,概率满足$p(i)\propto k_i^{1.08}$($k_i$表示企业$i$的[[供应连接数]])。我们校准了一个能复现匈牙利主导供应链网络典型特征的简易[[统计网络生成模型]],该模型不仅再现了[[入/出度分布]]、[[同配性]]和[[聚类结构]]等[[局部网络特征]],还捕捉到真实的[[系统性风险]]轮廓。最后探讨了[[经济重连动态]]对量化[[系统韧性]]和估计[[冲击传导]]的关键作用。 == 摘要 == * '''原文标题''':Ion beam treatment of thick polystyrene films * '''中文标题''':厚聚苯乙烯薄膜的离子束处理 * '''发布日期''':2025-03-26 09:39:21+00:00 * '''作者''':Alexey Kondyurin * '''分类''':physics.chem-ph *'''原文链接''':http://arxiv.org/abs/2503.20359v1 '''中文摘要''':摘要:在[[硅片]]上旋涂厚度为78 nm至1.3 μm的[[聚苯乙烯]]薄膜经20 keV[[氮离子]]束处理后,[[椭偏仪]]测量和[[傅里叶变换红外光谱]]显示表面改性层深度与离子在[[聚合物]]中的[[穿透深度]](约70 nm)相符。然而,深层洗涤及后续测试表明,薄改性层中形成的[[自由基]]会迁移至[[本体层]],导致深层[[聚苯乙烯]]化学结构发生系列变化。因此,尽管离子在[[聚苯乙烯]]膜中的[[穿透深度]]较浅,但整个薄膜的[[改性深度]]远超[[离子投影射程]]。这表明[[离子束]]处理[[聚合物]]仅能视作[[表面改性]]方法是有条件的,必须考虑[[自由基反应]]及其向[[聚合物]]深层迁移的可能性。 == 摘要 == * '''原文标题''':The Scalar Size of the Pion from Lattice QCD * '''中文标题''':格点QCD中π介子的标量大小 * '''发布日期''':2025-03-26 16:20:11+00:00 * '''作者''':Konstantin Ottnad, Georg von Hippel * '''分类''':hep-lat, hep-ph *'''原文链接''':http://arxiv.org/abs/2503.20687v1 '''中文摘要''':我们提出了一种[[系统误差]]完全受控的[[格点QCD]]计算,用于确定[[π介子]][[标量形状因子]]及相关[[半径]]。计算结果基于17组[[Nf=2+1]][[威尔逊Clover]][[改进海夸克]]的[[规范系综]],这些系综覆盖了0.049-0.086fm四种[[晶格间距]]、130-350MeV的[[π介子质量]]范围及多种[[物理体积]]。通过对著名[[夸克断开贡献]]的精确测定,首次在接近[[物理夸克质量]]的大尺寸精细系综上实现了[[形状因子]]前所未有的[[动量分辨率]]。采用1.0-3.25fm宽范围的[[源汇分离距离]],可靠地提取了[[零动量转移]]和[[非零动量转移]]下的[[基态矩阵元]]。这使得我们首次能通过[[形状因子]][[Q²依赖性]]的[[z展开]][[参数化]](而非小动量转移下的简单[[线性近似]])获得[[标量半径]]。使用[[三味]][[NLO]][[手征微扰理论]]对半径进行[[物理外推]],以三个[[低能常数]](包括[[L₄ʳ]]的首个[[格点测定]]结果)参数化[[夸克质量依赖性]]。通过基于[[赤池信息准则]]的[[模型平均]]方法,系统评估了[[基态提取]]、[[形状因子]][[参数化]]及[[物理外推]]等环节对最终结果的[[系统不确定性]]。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数极大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':我们研究一维[[高斯分布|高斯]][[位置混合模型]]的[[非参数统计|非参数]][[最大似然估计]]量$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定n个[[数据点]]时,该估计量始终返回最多含n个分量的[[混合模型]];而近期(Wu-Polyanskiy, 2020)对[[亚高斯分布|亚高斯]][[数据]]给出了严格的$O(\log n)$界。本文重点研究$\widehat{\pi}$的[[计算复杂性|计算特性]]:我们提出的[[算法]]能在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算出[[Wasserstein距离]]意义下的$\varepsilon$[[近似解]],其中$K$与数据相关但与$\varepsilon$无关,$C$为[[绝对常数]],$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的[[原子数]]。我们还可在有限时间内精确计算$|supp(\widehat\pi)|$值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$来自具有[[概率密度函数|密度]](相对于[[Lebesgue测度]])的[[概率分布]]时,这些保证几乎必然成立。我们还证明:当$k\leq \sqrt{n}/3$时,限定为k原子型的$\widehat\pi$[[条件分布]]在相关$2k-1$维[[参数空间]]上存在密度,且[[EM算法]]几乎必然具有[[收敛速度|局部线性收敛性]]。关键工具之一是[[非退化曲线]]的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子势的大规模长时质子交换膜质子传输原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习原子间势]]([[MLIP]]s)作为一种能够实现大规模、长时间[[原子模拟]]并保持与基于[[密度泛函理论]]([[DFT]])和[[从头算波函数理论]]的[[电子结构计算]]相当精度的方法,受到广泛关注。然而,基于[[MLIP]]的[[分子动力学]]([[MD]])模拟相较于传统[[经典势]]的模拟稳定性较低。分析高度异质体系或[[非晶材料]]通常需要大规模长时间模拟,因此亟需开发能够实现稳定[[MD]]模拟的[[鲁棒性]][[MLIP]]s。本研究利用我们的[[神经网络势]]([[NNP]])生成器,构建了一个能够在广泛水合水平下对[[全氟离聚物膜]]([[Nafion]])进行大规模长时间[[MD]]模拟的[[NNP]]模型。通过[[主动学习]]循环迭代扩展数据集,我们成功建立了鲁棒的[[深度势]]([[DP]])模型。具体而言,通过结合非平衡[[DPMD]]模拟的非平衡结构采样与包含最小原子间距的[[三维结构特征空间]]中的结构筛选,可显著增强[[DP]]模型的鲁棒性,从而实现对约10,000至20,000原子的大型[[Nafion]]体系进行长达31 ns的稳定[[MD]]模拟。采用所开发[[DP]]模型的[[MD]]模拟获得的[[氢原子]][[自扩散系数]],在广泛水合水平范围内比先前较小体系的[[从头算MD]]模拟更接近[[实验值]]。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:开放、快速、可靠且高效的每日任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过在多位置复制地址来降低[[延迟]]并增强[[韧性]]。鉴于[[任播]]在现代[[互联网]]中的关键作用,早期研究已开发出多种任播普查工具。首款工具[[iGreedy]]通过地理分散的延迟测量来绘制任播部署图;第二款工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查,其优势在于3小时内即可完成全网普查,但存在[[准确性]]和[[精度]]问题。反观iGreedy虽精度极高但速度较慢,且[[探测成本]]显著更高。 本文针对两套系统的缺陷,提出升级版[[MAnycast Reloaded]](MAnycastR)。我们在MAnycast2基础上彻底重构了[[测量管道]],新增[[分布式探测]]支持、多[[协议]]([[UDP]]/[[TCP]]/[[IPv6]])兼容性以及类iGreedy的延迟测量功能。通过在含32个全球分布式节点的任播[[测试床]]进行验证,与真实任播部署对比测试,并利用[[RIPE Atlas]]进行大规模延迟测量交叉检验(其中60%以上检测到的任播前缀通过[[运营商数据]]复核),证明MAnycastR具备高准确性与精确度。我们将持续提供每日任播普查数据,并以宽松[[开源协议]]发布工具[[源代码]]。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':基于属性图的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':摘要:给定[[图]]$G$和[[种子节点]]$v_s$,[[局部图聚类]](LGC)的目标是在与$C_s$大小大致成线性关系的时间内,识别出围绕$v_s$的[[子图]]$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图]]的[[应用场景]]。然而,现有解决方案大多仅依赖图中节点的[[拓扑连接性]],容易受到现实图数据中普遍存在的[[缺失]]或[[噪声链接]]的影响。为解决该问题,本文利用[[图拓扑]]与[[节点属性]]的互补特性来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将LGC建模为[[双向扩散分布]](BDD)的估计问题,该模型专门用于捕捉带属性节点的[[多跳关联性]]。进一步提出[[LACA]]方法——一种高效且具备严格[[理论保证]]的LGC方案,其核心包括:(i) 基于[[理论基础]]的快速[[节点属性预处理]]技术;(ii) 具有[[自适应扩散]]能力和[[加速收敛]]特性的[[向量传播算法]];(iii) 高效的[[三步式BDD近似框架]]。在8个[[真实数据集]]上与17种[[对比方法]]的实验表明,LACA在[[真实局部簇]]的[[评估指标]]上全面优于所有[[基线方法]],同时[[速度提升]]达[[数量级]]。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重构动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成了任何社会的结构性支柱。它们通过协调地球上几乎每一个个体,形成了为所有人生产一切的社会[[新陈代谢系统]]。SCN绝非静态存在,而是通过[[企业]]的进出与[[供应关系]]的[[重组]]持续演变。本研究利用独特[[数据集]]追踪了一个国家SCN中企业及其[[供应商]]-[[客户关系]]的时间演化。基于[[匈牙利]]2014至2022年每月报告的[[增值税]]数据,我们重建了包含711,248家企业和38,644,400条连接的整体[[经济网络]],实现了企业级分辨率下完整[[经济体系]]重组事件的全面覆盖。研究发现:每年约25%的企业退出SCN,同时28%的新企业加入;平均55%的现存[[供应链接]]会在次年消失;供应链接的[[半衰期]]为13个月。新链接以超[[偏好依附]]概率$p(i)\propto k_i^{1.08}$($k_i$表示企业i的供应连接数)附着于企业。我们校准了一个能复现匈牙利主导SCN典型特征的简易[[统计网络]]生成模型,该模型不仅再现了[[入度]]/[[出度]]分布、[[同配性]]和[[聚类结构]]等局部[[网络特征]],还捕捉到真实的[[系统性风险]]轮廓。最后探讨了[[经济重连]]动态对量化[[系统韧性]]和评估[[冲击传导]]的关键作用。 == 摘要 == * '''原文标题''':Ion beam treatment of thick polystyrene films * '''中文标题''':厚聚苯乙烯薄膜的离子束处理 * '''发布日期''':2025-03-26 09:39:21+00:00 * '''作者''':Alexey Kondyurin * '''分类''':physics.chem-ph *'''原文链接''':http://arxiv.org/abs/2503.20359v1 '''中文摘要''':摘要:在[[硅片]]上旋涂厚度为78[[纳米]]至1.3[[微米]]的不同厚度[[聚苯乙烯]][[薄膜]],并用能量为20 [[keV]]的[[氮离子]]进行处理。[[椭圆偏振测量]]和[[傅里叶变换红外光谱]]显示,表面层的改性对应于离子在[[聚合物]]中的[[穿透深度]](约70纳米)。然而,对深层进行清洗和后续测量表明,在薄改性层中形成的[[自由基]]迁移到体层中,并引起深层聚苯乙烯[[化学结构]]的多种变化。因此,尽管离子在聚苯乙烯薄膜中的穿透深度较小,但整个薄膜的改性深度远大于离子的[[投影射程]]。因此,[[离子束]]处理聚合物仅在条件上是一种[[表面改性]]方法。必须考虑自由基反应及其向聚合物深层迁移的可能性。 == 摘要 == * '''原文标题''':The Scalar Size of the Pion from Lattice QCD * '''中文标题''':格点QCD中π介子的标量大小 * '''发布日期''':2025-03-26 16:20:11+00:00 * '''作者''':Konstantin Ottnad, Georg von Hippel * '''分类''':hep-lat, hep-ph *'''原文链接''':http://arxiv.org/abs/2503.20687v1 '''中文摘要''':我们提出了一种[[系统误差]]完全受控的[[格点QCD]]计算,用于确定[[π介子]][[标量形状因子]]及相关[[半径]]。计算结果基于17组[[Nf=2+1]][[威尔逊Clover]][[改进海夸克]]的[[规范系综]],这些系综覆盖了0.049-0.086[[fm]]四种[[晶格间距]]、130-350[[MeV]]的[[π介子质量]]范围以及多种[[物理体积]]。通过对著名的[[夸克断开贡献]]的精确测定,我们首次在接近[[物理夸克质量]]的大尺寸精细系综上实现了[[形状因子]]前所未有的[[动量分辨率]]。采用1.0-3.25[[fm]]宽范围的[[源汇分离距离]],可靠地提取了[[零动量转移]]和[[非零动量转移]]下的[[基态矩阵元]]。这使得我们首次能通过所得[[形状因子]][[Q²依赖性]]的[[z展开]][[参数化]](而非小动量转移下的简单[[线性近似]])来获取[[标量半径]]。使用三味[[NLO]][[手征微扰理论]]对[[半径]]进行[[物理外推]],以三个[[低能常数]](包括首次[[格点测定]]的[[L₄ʳ]])参数化[[夸克质量依赖性]]。通过基于[[赤池信息准则]]的[[模型平均]],我们量化了[[基态提取]]、[[形状因子]][[参数化]]以及[[物理外推]]等环节对最终结果的[[系统不确定性]]。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数最大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':我们研究一维[[高斯分布|高斯]][[位置混合模型]]的[[非参数统计|非参数]][[极大似然估计]]量$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定包含$n$个[[数据点]]的[[数据集]],该估计量总是返回最多包含$n$个[[混合模型|分量]]的混合模型,而近期(Wu-Polyanskiy, 2020)对[[亚高斯分布|亚高斯数据]]给出了尖锐的$O(\log n)$界。本文重点研究$\widehat{\pi}$的[[计算复杂性|计算特性]]:我们提出一种[[算法]],当$\varepsilon>0$足够小时,可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算出[[Wasserstein距离]]意义下的$\varepsilon$-近似解$\widehat\pi$。其中$K$与数据相关但与$\varepsilon$无关,$C$为[[绝对常数]],$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的[[原子(测度论)|原子]]数量。我们还可在有限时间内确定性计算出$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$中的点独立采样自具有(相对于[[勒贝格测度]]的)[[概率密度函数|密度函数]]的[[概率分布]]时,这些保证几乎必然成立。我们还证明:当限定为$k$原子时,$\widehat\pi$的[[条件分布]]在相关$2k-1$维[[参数空间]]上存在密度函数(对所有$k\leq \sqrt{n}/3$成立),且[[EM算法]]几乎必然具有[[收敛速度|局部线性收敛性]]。关键工具之一是针对[[非退化曲线]]的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习]][[原子间势能]]([[MLIPs]])作为一种能够实现大规模、长时间[[原子模拟]]的方法备受关注,同时保持与基于[[密度泛函理论]]([[DFT]])和[[从头算波函数理论]]的[[电子结构计算]]相当的精度。然而,基于[[MLIP]]的[[分子动力学]]([[MD]])模拟面临的挑战是其稳定性低于使用传统[[经典势能]]的模拟。分析高度异质体系或[[非晶材料]]通常需要大规模和长时间的模拟,因此需要开发能够实现稳定[[MD模拟]]的鲁棒[[MLIPs]]。在本研究中,我们利用[[神经网络势能]]([[NNP]])生成器,构建了一个[[NNP模型]],能够在广泛[[水合水平]]下对[[全氟离聚物膜]]([[Nafion]])进行大规模、长时间的[[MD模拟]]。通过[[主动学习]]循环迭代扩展数据集,我们成功建立了鲁棒的[[深度势能]]([[DP]])模型。具体而言,通过结合非平衡[[DPMD]]模拟采样的非平衡结构,以及在包含最小[[原子间距离]]的[[3D结构]]特征空间中进行结构筛选,可以显著增强[[DP模型]]的鲁棒性,从而实现对约10,000至20,000个原子的大型[[Nafion系统]]进行长达31 ns的稳定[[MD模拟]]。采用所开发[[DP模型]]的[[MD模拟]]得到的[[氢原子]][[自扩散系数]],在广泛[[水合水平]]范围内与[[实验值]]更为接近,优于先前对小体系进行的[[从头算MD模拟]]结果。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:一个开放、快速、可靠且高效的每日任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过将地址复制到多个位置来实现降低[[延迟]]和增强[[韧性]]等目标。由于任播在现代[[互联网]]中的关键作用,先前研究已开发了执行任播普查的工具。首个工具[[iGreedy]]利用地理分散位置的延迟测量来绘制任播部署图;第二个工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查,但存在[[准确性]]和[[精确性]]问题。相反,iGreedy准确性极高但速度较慢,且探测成本更高。 本文针对这两个系统的缺陷,提出了升级版[[MAnycast Reloaded]](MAnycastR)。以MAnycast2为基础,我们彻底重构了其测量管道,新增[[分布式探测]]支持、额外[[协议]]([[UDP]]、[[TCP]]和[[IPv6]])支持以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播[[测试平台]]上验证MAnycastR,对比实际任播生产部署,并通过[[RIPE Atlas]]进行大规模延迟测量,同时将检测到的60%以上任播[[前缀]]与[[运营商]]真实数据进行交叉验证。结果表明MAnycastR实现了高准确性与精确度。我们将持续提供每日MAnycastR普查数据,并以宽松[[开源协议]]发布工具[[源代码]]。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':基于属性图的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':摘要:给定[[图]]$G$和[[种子节点]]$v_s$,[[局部图聚类]](LGC)的目标是在与$C_s$大小近似线性相关的时间内,识别出围绕$v_s$的[[子图]]$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图]]的[[应用场景]]。然而,现有解决方案大多仅依赖图中节点的[[拓扑连接性]],容易受到现实图谱中普遍存在的[[缺失]]或[[噪声链接]]的影响。 为解决该问题,本文利用[[图拓扑]]与[[节点属性]]的互补特性来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将LGC建模为[[双向扩散分布]](BDD)的估计问题,该模型专门用于捕捉含属性节点的[[多跳关联性]]。进一步提出[[LACA]]方法——一种高效且具备严格[[理论保证]]的LGC方案,其核心包含:(i) 基于[[理论基础]]的快速[[节点属性预处理]]技术,(ii) 具有[[自适应扩散]]能力和[[加速收敛]]特性的[[向量传播算法]],(iii) 高效的[[三步式BDD近似框架]]。在8个[[真实数据集]]上与17种[[基线方法]]的对比实验表明,LACA在[[真实局部簇]]的[[评估指标]]上全面优于所有对比方法,同时[[速度提升]]达[[数量级]]。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重连动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成了任何[[社会]]的[[结构性支柱]]。它们通过协调[[地球]]上几乎每一个[[个体]],形成了为所有人生产一切的[[社会新陈代谢系统]]。SCN绝非[[静态存在]],而是通过[[企业]]的进出和[[供应关系]]的[[重组]]不断演变。本研究利用独特[[数据集]]追踪了一个[[国家]]SCN中企业及其[[供应商]]-[[采购商]]关系的时序演化。基于[[匈牙利]]2014至2022年按月申报的[[增值税]]数据,我们重建了包含711,248家企业和38,644,400条连接的[[整体经济网络]],实现了[[企业级分辨率]]下完整[[经济体系]]的[[重构事件]]全覆盖。研究发现:每年约25%的企业退出SCN,同时28%的新企业进入;平均55%的现存[[供应链接]]会在次年消失;供应链接的[[半衰期]]为13个月。新链接以超[[偏好依附]]概率$p(i)\propto k_i^{1.08}$($k_i$表示企业i的供应连接数)附着于企业。我们校准的简易[[统计网络]]生成模型成功复现了匈牙利主导SCN的典型特征,不仅能重现[[入/出度分布]]、[[同配性]]和[[聚类结构]]等局部[[网络特征]],还可捕捉真实的[[系统性风险]]轮廓。该模型揭示了[[经济重连动态]]对量化[[系统韧性]]和评估[[冲击传导]]的关键作用。 == 摘要 == * '''原文标题''':Ion beam treatment of thick polystyrene films * '''中文标题''':厚聚苯乙烯薄膜的离子束处理 * '''发布日期''':2025-03-26 09:39:21+00:00 * '''作者''':Alexey Kondyurin * '''分类''':physics.chem-ph *'''原文链接''':http://arxiv.org/abs/2503.20359v1 '''中文摘要''':摘要:在[[硅片]]上旋涂厚度为78 nm至1.3 μm的[[聚苯乙烯]]薄膜经20 keV[[氮离子]]束处理后,[[椭偏仪]]测量和[[傅里叶变换红外光谱]]显示表面改性层深度与离子在[[聚合物]]中的穿透深度(约70 nm)相符。然而,深层洗涤及后续测试表明,薄改性层中形成的[[自由基]]会迁移至本体层,导致深层聚苯乙烯发生一系列[[化学结构]]变化。因此,尽管离子在聚苯乙烯薄膜中的穿透深度较浅,但整个薄膜的改性深度远超过[[离子投影射程]]。这表明[[离子束]]处理仅能条件性地视为[[表面改性]]方法,必须考虑自由基反应及其向聚合物深层迁移的可能性。 == 摘要 == * '''原文标题''':The Scalar Size of the Pion from Lattice QCD * '''中文标题''':格点QCD中π介子的标量大小 * '''发布日期''':2025-03-26 16:20:11+00:00 * '''作者''':Konstantin Ottnad, Georg von Hippel * '''分类''':hep-lat, hep-ph *'''原文链接''':http://arxiv.org/abs/2503.20687v1 '''中文摘要''':我们提出了一种[[系统误差]]完全受控的[[格点QCD]]计算,用于确定[[π介子]][[标量形状因子]]及相关[[半径]]。计算结果基于17个[[规范系综]]的大规模数据集,这些系综采用$N_f=2+1$[[威尔逊Clover改进]]的[[海夸克]]配置。这些系综覆盖了从$a=0.049\mathrm{fm}$到$a=0.086\mathrm{fm}$四种[[格点间距]],[[π介子质量]]范围为$130-350\mathrm{MeV}$以及多种[[物理体积]]。通过对著名的[[夸克断开贡献]]的精确测定,我们首次在[[物理夸克质量]]附近的大尺度精细系综上实现了形状因子前所未有的[[动量分辨率]]。采用$1.0\mathrm{fm} \lesssim t_\mathrm{sep} \lesssim 3.25\mathrm{fm}$范围内多种[[源-汇间距]],可靠地提取了[[零动量转移]]和[[非零动量转移]]下的[[基态矩阵元]]。这使得我们能够首次通过所得形状因子$Q^2$依赖性的$z$[[展开参数化]](而非小动量转移下的简单[[线性近似]])来获取[[标量半径]]。半径的[[物理外推]]采用三味[[NLO手征微扰理论]],通过三个[[低能常数]](包括$L_4^r$的首次[[格点测定]])来参数化[[夸克质量依赖性]]。基于[[赤池信息准则]]的[[模型平均方法]],我们对[[基态提取]]、形状因子参数化以及物理外推等环节产生的系统误差进行了量化处理。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数极大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':我们研究一维[[高斯分布|高斯]][[位置混合模型]]的[[非参数统计|非参数]][[极大似然估计]]量$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定n个[[数据点]]时该估计量总是返回最多含n个分量的[[混合模型]],而近期(Wu-Polyanskiy, 2020)对[[亚高斯分布|亚高斯]][[数据]]给出了严格的$O(\log n)$界。本文研究$\widehat{\pi}$的计算特性:我们提出一种[[算法]],当$\varepsilon>0$足够小时,可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算[[Wasserstein距离]]下的$\varepsilon$[[近似解]],其中$K$依赖数据但与$\varepsilon$无关,$C$为[[绝对常数]],$k=|supp(\widehat{\pi})|\leq n$是$\widehat\pi$的[[原子数]]。我们还可在[[有限时间]]内[[确定性算法|确定性]]计算$|supp(\widehat\pi)|$的[[精确值]]。当[[数据集]]$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$来自具有[[概率密度函数|密度]](相对于[[Lebesgue测度]])的[[概率分布]]时,这些保证几乎必然成立。我们还证明:当$k\leq \sqrt{n}/3$时,限定为k原子的$\widehat\pi$[[条件分布]]在相关$2k-1$维[[参数空间]]上存在密度,且[[EM算法]]几乎必然具有[[局部收敛性|局部线性收敛性]]。关键工具之一是[[非退化曲线]]的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子势的大规模长时质子交换膜质子传输原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习原子间势]]([[MLIPs]])作为一种能够实现大规模、长时间[[原子模拟]]的方法备受关注,同时保持与基于[[密度泛函理论]]([[DFT]])和[[从头算波函数理论]]的[[电子结构计算]]相当的精度。然而,基于[[MLIP]]的[[分子动力学]]([[MD]])模拟面临的挑战是其稳定性低于使用传统[[经典势]]的模拟。分析高度异质体系或[[非晶材料]]通常需要大规模和长时间的模拟,因此需要开发能够实现稳定[[MD模拟]]的鲁棒[[MLIP]]。在本研究中,我们利用[[神经网络势]]([[NNP]])生成器,构建了一个[[NNP模型]],能够在广泛[[水合水平]]下对[[全氟离聚物膜]]([[Nafion]])进行大规模、长时间的[[MD模拟]]。通过[[主动学习]]循环迭代扩展数据集,我们成功建立了鲁棒的[[深度势]]([[DP]])模型。具体而言,通过将非平衡[[DPMD]]模拟采样的非平衡结构与结合最小[[原子间距]]的三维[[结构特征空间]]中的结构筛选相结合,可以显著增强[[DP模型]]的鲁棒性,从而实现对约10,000至20,000个原子的大型[[Nafion系统]]进行长达31 ns的稳定[[MD模拟]]。采用所开发[[DP模型]]的[[MD模拟]]得到的[[氢原子]]自[[扩散系数]],在广泛[[水合水平]]范围内与[[实验值]]更为接近,优于先前对小体系进行的[[从头算MD模拟]]结果。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:开放、快速、可靠且高效的每日任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过将地址复制到多个位置来实现(例如)降低[[延迟]]和增强[[韧性]]。由于任播在现代[[互联网]]中的关键作用,先前研究已开发了执行任播普查的工具。首个工具[[iGreedy]]利用地理分散位置的延迟测量来映射任播部署;第二个工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——能在3小时内完成全网普查,但存在[[准确性]]和[[精确性]]问题。相反,iGreedy精度极高但速度较慢,且探测成本更高。 本文针对这两个系统的缺陷,提出了[[MAnycast Reloaded]](MAnycastR)。我们以MAnycast2为基础,彻底重构其测量流程,新增[[分布式探测]]支持、额外[[协议]]([[UDP]]、[[TCP]]和[[IPv6]])支持,以及类似iGreedy的延迟测量功能。通过在含32个全球分布式节点的任播[[测试床]]上验证,与外部任播生产部署对比,结合[[RIPE Atlas]]的广泛延迟测量,并对检测到的任播[[前缀]]中超过60%进行[[运营商]]真实数据交叉核验,证明MAnycastR具备高准确性与精确性。我们将持续提供每日MAnycastR普查数据,并以宽松[[开源协议]]发布工具[[源代码]]。 == 摘要 == * '''原文标题''':Flow of a two-dimensional liquid foam: Impact of surfactant type and boundary conditions * '''中文标题''':二维液体泡沫的流动:表面活性剂类型和边界条件的影响 * '''发布日期''':2025-03-26 16:44:40+00:00 * '''作者''':Farshad Nazari, Andrei Potanin, Hadi Mohammadigoushki * '''分类''':cond-mat.soft, physics.flu-dyn *'''原文链接''':http://arxiv.org/abs/2503.20710v1 '''中文摘要''':本研究通过实验探究了[[二维]]单分散[[水性泡沫]]在平行板间剪切时的[[流变]]与[[流动行为]],采用自制配备光滑/粗糙壁面的[[流变光学装置]]。使用两种市售[[洗涤剂]](Foam 1与Foam 2)制备泡沫,保持[[气泡尺寸]]与[[液相分数]]相近。线性[[粘弹性]]结果表明:无论[[边界条件]]如何,Foam 1始终表现出比Foam 2更高的[[弹性模量]]与[[损耗模量]],且粗糙壁面会进一步强化两种泡沫的模量。此外,Foam 1的粘弹性[[弛豫频率]]更低,表明其[[界面迁移性]]较弱。在非线性区域观察到显著差异:光滑边界条件下,Foam 2呈现[[屈服应力]]行为而Foam 1未出现,尽管后者具有更高[[粘性应力]]。Foam 1的粘性应力与[[毛细数]]呈标度关系,而Foam 2的标度行为依边界条件(光滑/粗糙壁面)呈现差异。这些流变行为差异源于[[表面活性剂]]化学性质不同导致的界面迁移性差异,Foam 1的界面迁移性相对Foam 2更弱。 == 摘要 == * '''原文标题''':Search for events with one displaced vertex from long-lived neutral particles decaying into hadronic jets in the ATLAS muon spectrometer in $pp$ collisions at $\sqrt{s}=13$ TeV * '''中文标题''':在$\sqrt{s}=13$ TeV的$pp$对撞中ATLASμ子谱仪内长寿命中性粒子衰变为强子喷注产生单位移顶点的事例搜寻 * '''发布日期''':2025-03-26 11:21:36+00:00 * '''作者''':ATLAS Collaboration * '''分类''':hep-ex *'''原文链接''':http://arxiv.org/abs/2503.20445v1 '''中文摘要''':摘要:本文报道了利用[[大型强子对撞机]][[ATLAS探测器]]在2015-2018年收集的$\sqrt{s}=13$ TeV[[质子]]-[[质子]]对撞数据(积分亮度140 fb$^{-1}$),对[[长寿命中性粒子]]衰变为[[强子]][[喷注]]产生[[单位移顶点]]事件的搜寻。该研究采用特殊[[重建技术]],针对[[μ子]][[谱仪]]中距主[[相互作用顶点]]3-14米处衰变的[[长寿命粒子]][[顶点]]进行重建。观测事件数与预期[[本底]]相符,并对多个基准[[信号模型]]设定了限制。研究考虑了[[标量]][[门户模型]]和[[希格斯玻色子]][[门户]][[重子生成模型]],并专门设计了[[分析通道]]来研究[[Z玻色子]]伴随的[[长寿命粒子]]产生(包括[[类轴子粒子]]和[[暗光子]][[模型]])。对于[[希格斯玻色子]][[模型]],在95%[[置信水平]]下排除了[[长寿命粒子]][[固有衰变长度]]在5厘米至40米范围内[[分支比]]高于1%的情况。针对所研究的[[避光]][[类轴子粒子]][[模型]],本次搜寻对[[固有衰变长度]]大于$\mathcal{O}(10)$厘米的情况给出了迄今最强的限制。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':基于属性图的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':摘要:给定[[图]]$G$和[[种子节点]]$v_s$,[[局部图聚类]](LGC)的目标是在与$C_s$大小大致成线性关系的时间内,识别出围绕$v_s$的[[子图]]$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图]]的[[应用场景]]。然而,现有解决方案大多仅依赖图中节点的[[拓扑连接性]],容易受到现实图数据中普遍存在的[[缺失]]或[[噪声链接]]的影响。为解决该问题,本文利用[[图拓扑]]与[[节点属性]]的[[互补特性]]来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将LGC建模为[[双向扩散分布]](BDD)的[[估计问题]],该模型专门用于捕捉含属性节点的[[多跳关联性]]。进一步提出[[LACA]]方法——一种高效且具备强[[局部性]]的LGC解决方案,在多个[[真实数据集]]上表现出卓越性能。其核心组件包括:(i)基于[[理论基础]]的快速[[节点属性预处理]]技术;(ii)具有严格[[理论保证]]和[[加速收敛]]特性的[[自适应向量扩散算法]];(iii)BDD[[近似计算]]的有效[[三步方案]]。在8个[[真实数据集]]上与17种[[对比方法]]的实验表明,LACA在[[真实局部簇]]的[[衡量标准]]下结果质量最优,同时速度可提升数个[[数量级]]。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重构动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成了任何[[社会]]的[[结构性支柱]]。它们通过协调[[地球]]上几乎每一个[[个体]],形成了为所有人生产一切的[[社会新陈代谢系统]]。SCN绝非[[静态存在]],而是通过[[企业]]的进出与[[供应关系]]的[[重组]]持续[[演变]]。本研究利用独特[[数据集]]追踪了一个[[国家]]SCN中企业及其[[供应商]]-[[客户关系]]的[[时间演化]]。基于[[匈牙利]]2014至2022年每月报告的[[增值税]]数据,我们重建了包含711,248家企业和38,644,400条连接的完整[[经济网络]],实现了[[企业级分辨率]]下整个[[经济体]][[重组事件]]的完整记录。研究发现:每年约25%的企业退出SCN,同时28%的新企业加入;平均55%的现存[[供应链接]]会在次年消失;供应链接的[[半衰期]]为13个月。新链接以[[超偏好依附]]概率$p(i)\propto k_i^{1.08}$($k_i$表示企业i的[[供应连接数]])与企业建立关联。我们校准了一个能复现匈牙利主导SCN典型特征的简易[[统计网络生成模型]],该模型不仅重现了[[入/出度分布]]、[[同配性]]和[[聚类结构]]等[[局部网络特征]],还捕捉到真实的[[系统性风险]]轮廓。最后探讨了[[经济重连动态]]对量化[[系统韧性]]和估计[[冲击传导]]的关键作用。 == 摘要 == * '''原文标题''':Ion beam treatment of thick polystyrene films * '''中文标题''':厚聚苯乙烯薄膜的离子束处理 * '''发布日期''':2025-03-26 09:39:21+00:00 * '''作者''':Alexey Kondyurin * '''分类''':physics.chem-ph *'''原文链接''':http://arxiv.org/abs/2503.20359v1 '''中文摘要''':摘要:在[[硅片]]上旋涂厚度为78纳米至1.3微米的不同厚度[[聚苯乙烯]]薄膜,并用能量为20 keV的[[氮离子]]进行处理。[[椭圆偏振测量]]和[[傅里叶变换红外光谱]]显示,表面层的改性对应于离子在[[聚合物]]中的穿透深度(约70纳米)。然而,对深层进行清洗和后续测量表明,在薄改性层中形成的[[自由基]]迁移到体层中,并引起深层聚苯乙烯[[化学结构]]的诸多变化。因此,尽管离子在聚苯乙烯薄膜中的穿透深度较小,但整个薄膜的改性深度远大于离子的[[投影射程]]。因此,[[离子束]]处理聚合物仅在特定条件下是一种表面改性方法。必须考虑自由基反应及其向聚合物深层迁移的可能性。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:开放、快速、可靠且高效的每日任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过将地址复制到多个位置来实现降低[[延迟]]和增强[[韧性]]等目标。由于任播在现代[[互联网]]中的关键作用,先前研究已开发了执行任播普查的工具。首个工具[[iGreedy]]利用地理分散位置的延迟测量来绘制任播部署图;第二个工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查,但存在[[准确性]]和[[精确性]]问题。反之,iGreedy精度极高但速度较慢,且探测成本更高。 本文针对这两个系统的缺陷,提出了[[MAnycast Reloaded]](MAnycastR)。我们以MAnycast2为基础,彻底重构其测量流水线,新增[[分布式探测]]支持、额外[[协议]]([[UDP]]、[[TCP]]和[[IPv6]])支持以及类似iGreedy的延迟测量功能。通过在含32个全球分布式节点的任播测试床上验证,与外部任播生产部署对比,结合[[RIPE Atlas]]的广泛延迟测量,并对检测到的60%以上任播前缀进行[[运营商]]数据交叉核验,证明MAnycastR具备高准确性与精确性。我们将持续提供每日MAnycastR普查数据,并以宽松[[开源协议]]发布工具[[源代码]]。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数极大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':我们研究一维[[高斯分布|高斯]][[位置混合模型]]的[[非参数统计|非参数]][[最大似然估计]]量$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定n个[[数据点]]时该估计量总是返回最多含n个分量的[[混合模型]],而近期(Wu-Polyanskiy, 2020)对[[亚高斯分布|亚高斯]][[数据]]给出了严格的$O(\log n)$界。本文研究$\widehat{\pi}$的[[计算复杂性|计算特性]]:我们提出一种[[算法]],当$\varepsilon>0$足够小时,可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算出[[Wasserstein距离]]意义上的$\varepsilon$[[近似解]],其中$K$与数据相关但与$\varepsilon$无关,$C$为[[绝对常数]],$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的[[原子数量]]。我们还可在有限时间内[[确定性算法|确定性]]计算$|supp(\widehat\pi)|$的[[精确值]]。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有[[密度函数]](相对于[[勒贝格测度]])的[[概率分布]]独立[[采样]]生成时,这些保证几乎必然成立。我们还证明:当$k\leq \sqrt{n}/3$时,限定为k原子结构的$\widehat\pi$[[条件分布]]在相关$2k-1$维[[参数空间]]上存在密度函数,且[[EM算法]]几乎必然具有[[局部收敛性|局部线性收敛性]]。其中关键工具是针对[[非退化曲线]]的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子势的大规模长时质子交换膜质子传输原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习原子间势]]([[MLIPs]])作为一种能够实现大规模、长时间[[原子模拟]]并保持与基于[[密度泛函理论]]([[DFT]])和[[从头算波函数理论]]的[[电子结构计算]]相当精度的方法,引起了广泛关注。然而,基于[[MLIP]]的[[分子动力学]]([[MD]])模拟面临的挑战是其稳定性低于传统[[经典势函数]]。分析高度异质体系或[[非晶材料]]通常需要大规模长时间模拟,这要求开发能够实现稳定[[MD模拟]]的鲁棒性[[MLIP]]。本研究利用我们的[[神经网络势]]([[NNP]])生成器,构建了一个[[NNP模型]],可在广泛[[水合水平]]范围内对[[全氟离聚物膜]]([[Nafion]])进行大规模长时间[[MD模拟]]。通过[[主动学习]]循环迭代扩展数据集,我们成功建立了鲁棒的[[深度势]]([[DP]])模型。具体而言,通过将非平衡[[DPMD模拟]]采样的非平衡结构与结合最小[[原子间距]]的三维[[结构特征空间]]筛选相结合,可显著提升[[DP模型]]的鲁棒性,从而实现对约10,000至20,000[[原子]]的大型[[Nafion体系]]进行长达31 [[ns]]的稳定[[MD模拟]]。采用所开发[[DP模型]]的[[MD模拟]]获得的[[氢原子]]自[[扩散系数]],在广泛[[水合水平]]范围内比先前小体系[[从头算MD模拟]]结果更接近[[实验值]]。 == 摘要 == * '''原文标题''':Flow of a two-dimensional liquid foam: Impact of surfactant type and boundary conditions * '''中文标题''':二维液体泡沫的流动:表面活性剂类型与边界条件的影响 * '''发布日期''':2025-03-26 16:44:40+00:00 * '''作者''':Farshad Nazari, Andrei Potanin, Hadi Mohammadigoushki * '''分类''':cond-mat.soft, physics.flu-dyn *'''原文链接''':http://arxiv.org/abs/2503.20710v1 '''中文摘要''':本研究通过实验探究了[[二维]]单分散[[水性泡沫]]在平行板间剪切时的[[流变]]与[[流动行为]],采用自制[[光流变仪]](配备光滑/粗糙[[壁面]])完成测试。使用两种市售[[洗涤剂]](Foam 1和Foam 2)制备泡沫,并保持[[气泡尺寸]]和[[液相分数]]一致。线性[[粘弹性]]结果表明:无论[[边界条件]]如何,Foam 1始终表现出比Foam 2更高的[[弹性模量]]和[[损耗模量]],且粗糙壁面会进一步强化两种泡沫的模量。此外,Foam 1的粘弹性[[弛豫频率]]更低,表明其[[界面流动性]]较弱。非线性区域则呈现显著差异:在光滑边界条件下,Foam 2表现出[[屈服应力]]行为而Foam 1未出现,尽管后者具有更高的[[粘性应力]]。Foam 1的粘性应力与[[毛细数]]呈标度关系,而Foam 2的标度行为则因光滑/粗糙壁面呈现不同模式。这些[[流变学]]差异源于[[表面活性剂]]化学性质导致的界面流动性差异,其中Foam 1的界面流动性低于Foam 2。 == 摘要 == * '''原文标题''':Search for events with one displaced vertex from long-lived neutral particles decaying into hadronic jets in the ATLAS muon spectrometer in $pp$ collisions at $\sqrt{s}=13$ TeV * '''中文标题''':在$\sqrt{s}=13$ TeV的$pp$对撞中ATLASμ子谱仪内长寿命中性粒子衰变为强子喷注产生单位移顶点的事例搜寻 * '''发布日期''':2025-03-26 11:21:36+00:00 * '''作者''':ATLAS Collaboration * '''分类''':hep-ex *'''原文链接''':http://arxiv.org/abs/2503.20445v1 '''中文摘要''':摘要:本文报道了利用[[ATLAS探测器]]在[[大型强子对撞机]]上收集的数据(2015-2018年记录的$\sqrt{s}=13$ TeV[[质子]]-[[质子]]对撞数据,积分亮度140 fb$^{-1}$)对[[长寿命中性粒子]]衰变为[[强子喷注]]产生[[单位移顶点]]事件的搜寻。该研究采用[[顶点重建]]技术,针对[[μ子谱仪]]中距[[初级相互作用顶点]]3-14米处衰变的[[长寿命粒子]]。观测事件数与预期本底相符,并确定了若干基准信号模型的限制。研究考虑了[[标量门户模型]]和[[希格斯玻色子]]门户[[重子生成模型]],同时设立专门分析通道针对[[Z玻色子]]伴随的[[长寿命粒子]]产生(包括[[类轴子粒子]]和[[暗光子]]模型)。对于[[希格斯玻色子]]模型,在95%置信水平下排除了[[长寿命粒子]]固有衰变长度5厘米至40米范围内分支比高于1%的情况;对于所研究的[[避光类轴子粒子]]模型,本次搜寻对固有衰变长度大于$\mathcal{O}(10)$厘米的情况给出了迄今最强的限制。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':基于属性图的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':摘要:给定[[图]]$G$和[[种子节点]]$v_s$,[[局部图聚类]](LGC)的目标是在与$C_s$大小大致成线性关系的时间内,识别出围绕$v_s$的[[子图]]$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图]]的[[应用场景]]。然而现有方案大多仅依赖图中节点的[[拓扑连接性]],容易受到现实[[图谱]]中普遍存在的[[缺失链接]]或[[噪声链接]]的影响。为解决该问题,本文利用[[图拓扑]]与[[节点属性]]的[[互补特性]]来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将LGC建模为[[双向扩散分布]](BDD)的[[估计问题]],该模型专门用于捕捉带属性节点的[[多跳关联性]]。进一步提出[[LACA]]方法——一种高效且具备严格[[理论保证]]的[[LGC]]方案,其核心组件包括:(i) 快速且理论完备的[[节点属性预处理]]技术;(ii) 具有[[理论收敛]]保证的[[自适应向量扩散算法]];(iii) 高效的[[三步式BDD近似]]方案。在8个[[真实数据集]]上与17种[[对比方法]]的实验表明,LACA在[[真实局部簇]]的[[衡量标准]]下全面优于所有对比方法,同时[[速度提升]]达[[数量级]]。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':Ion beam treatment of thick polystyrene films * '''中文标题''':厚聚苯乙烯薄膜的离子束处理 * '''发布日期''':2025-03-26 09:39:21+00:00 * '''作者''':Alexey Kondyurin * '''分类''':physics.chem-ph *'''原文链接''':http://arxiv.org/abs/2503.20359v1 '''中文摘要''':摘要:在[[硅片]]上旋涂厚度从78[[纳米]]至1.3[[微米]]不等的[[聚苯乙烯]][[薄膜]],经20 keV[[氮]][[离子束]]处理后,[[椭圆偏振测量]]和[[傅里叶变换红外光谱]]显示表面改性层深度与离子在[[聚合物]]中的[[穿透深度]](约70纳米)相符。然而,深层洗涤及后续测试表明,薄改性层中形成的[[自由基]]会迁移至[[本体层]],导致深层聚苯乙烯的[[化学结构]]发生系列变化。因此,尽管离子在聚苯乙烯膜中的穿透深度有限,整个薄膜的[[改性深度]]却远超过[[离子投影射程]]。这表明离子束处理仅能有条件地视为[[表面改性]]方法,必须考虑自由基反应及其向聚合物深层迁移的可能性。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:一个开放、快速、可靠且高效的每日任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过将地址复制到多个位置来实现(例如)降低[[延迟]]和增强[[韧性]]。由于任播在现代[[互联网]]中的关键作用,先前研究已开发了执行任播普查的工具。首个工具[[iGreedy]]利用地理分散位置的延迟测量来绘制任播部署图;第二个工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查,但存在[[准确性]]和[[精确性]]问题。相反,iGreedy精度极高但速度较慢,且探测成本更高。 本文针对这两个系统的缺陷提出了[[MAnycast Reloaded]]([[MAnycastR]])。以MAnycast2为基础,我们彻底重构了其测量流水线,新增[[分布式探测]]支持、额外[[协议]]([[UDP]]、[[TCP]]和[[IPv6]])支持以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR,对比实际任播生产部署,并通过[[RIPE Atlas]]进行广泛延迟测量,同时将检测到的60%以上任播前缀与[[运营商]]真实数据交叉核验。结果表明MAnycastR实现了高准确性与精确度。我们将持续提供每日MAnycastR普查数据,并以宽松[[开源协议]]发布工具[[源代码]]。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重构动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成任何[[社会]]的[[结构性支柱]]。它们通过协调[[地球]]上几乎每一个[[个体]],形成了为所有人生产一切的[[社会代谢系统]]。供应链网络绝非[[静态]],而是通过[[企业]]的进出和[[供应关系]]的[[重组]]不断变化。本研究利用独特[[数据集]]探究了一个[[国家]]供应链网络中企业及其[[供应商]]-[[客户关系]]的[[时间演化]]。基于[[匈牙利]]2014至2022年按月申报的[[增值税]]数据,我们重建了包含711,248家企业和38,644,400条[[连接关系]]的完整[[经济网络]],以[[企业级分辨率]]覆盖了整个[[经济体]]的几乎每次[[重构事件]]。研究发现:每年约25%的企业退出供应链网络,同时28%的[[新企业]]加入;平均55%的现存[[供应链接]]会在次年消失;供应链接的[[半衰期]]为13个月。新链接以[[超偏好依附]]概率$p(i)\propto k_i^{1.08}$连接企业($k_i$表示企业$i$的[[供应连接数]])。我们校准了一个能复现匈牙利主导供应链网络典型特征的简单[[统计网络生成模型]],该模型不仅复现了[[入/出度分布]]、[[同配性]]和[[聚类结构]]等[[局部网络特征]],还捕捉了真实的[[系统性风险]]特征。最后讨论了当前模型如何通过[[经济重连动态]]来量化[[系统韧性]]和估计[[冲击传导]]。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数最大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':摘要:我们研究一维[[高斯分布|高斯]][[位置混合]]的[[非参数估计|非参数]][[极大似然估计]]量$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定n个[[数据点]]时该估计量始终返回最多含n个分量的[[混合模型]],而近期(Wu-Polyanskiy, 2020)对[[次高斯分布|次高斯]][[数据]]给出了严格的$O(\log n)$界。本文研究$\widehat{\pi}$的[[计算复杂性|计算特性]]:提出一种[[算法]],当$\varepsilon>0$足够小时,可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算[[Wasserstein距离]]下的$\varepsilon$[[近似解]],其中$K$与数据相关但与$\varepsilon$无关,$C$为[[绝对常数]],$k=|supp(\widehat{\pi})|\leq n$为$\widehat\pi$的[[原子数]]。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有[[概率密度函数|密度]](相对于[[Lebesgue测度]])的[[概率分布]]独立生成时,这些保证几乎必然成立。我们还证明:当$k\leq \sqrt{n}/3$时,限定为k原子分布的$\widehat\pi$在其$2k-1$维[[参数空间]]上具有密度,且[[EM算法]]几乎必然[[局部收敛|局部线性收敛]]。关键工具之一是[[非退化曲线]]的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子势的大规模长时质子交换膜质子传输原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习原子间势能]]([[MLIPs]])作为一种能够实现大规模、长时间[[原子尺度模拟]]的方法备受关注,同时保持与基于[[密度泛函理论]]([[DFT]])和[[从头算波函数理论]]的[[电子结构计算]]相当的精度。然而,基于[[MLIP]]的[[分子动力学]]([[MD]])模拟面临的挑战是其稳定性低于使用传统[[经典势能]]的模拟。分析高度异质体系或[[非晶材料]]通常需要大规模和长时间的模拟,因此需要开发能够进行稳定[[MD模拟]]的鲁棒[[MLIPs]]。在本研究中,我们利用[[神经网络势能]]([[NNP]])生成器,构建了一个[[NNP模型]],能够在广泛水合水平下对[[全氟磺酸离聚物膜]]([[Nafion]])进行大规模、长时间的[[MD模拟]]。通过[[主动学习]]循环迭代扩展数据集,我们成功构建了鲁棒的[[深度势能]]([[DP]])模型。具体而言,通过结合非平衡[[DPMD]]模拟对非平衡结构的采样与在包含最小[[原子间距离]]的[[3D结构特征空间]]中的结构筛选,可以显著增强[[DP模型]]的鲁棒性,这使得能够对大约10,000至20,000个原子的大型[[Nafion]]体系进行长达31 ns的稳定[[MD模拟]]。采用所开发[[DP模型]]的[[MD模拟]]得到的[[氢原子]]自[[扩散系数]],在广泛的水合水平范围内,与先前较小体系的[[从头算MD模拟]]相比,更接近[[实验值]]。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':基于属性图的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':给定[[图]]$G$和种子节点$v_s$,[[局部图聚类]](LGC)的目标是在与$C_s$大小大致成线性关系的时间内,识别出围绕$v_s$的子图$C_s \in G$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图]]的应用场景。然而,现有解决方案大多仅依赖图中节点的[[拓扑连接性]],容易受到现实图数据中普遍存在的[[缺失链接]]或[[噪声链接]]的影响。 为解决这一问题,本文利用[[图拓扑]]与[[节点属性]]的互补特性来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将LGC建模为[[双向扩散分布]](BDD)的估计问题,该模型专门用于捕捉带属性节点的[[多跳关联性]]。进一步提出[[LACA]]方法——一种高效且具备强[[局部性]]的LGC解决方案,在多个[[真实数据集]]上表现出卓越性能。LACA的核心组件包括:(i)基于理论基础的快速[[节点属性预处理]]技术;(ii)具有严格理论保证和加速[[收敛特性]]的[[自适应向量扩散算法]];(iii)有效的BDD近似[[三步骤方案]]。通过在8个[[真实数据集]]上与17种对比方法的实验表明,LACA在真实[[局部簇]]的评估指标上全面优于所有对比方法,同时实现数量级的[[速度提升]]。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:开放、快速、可靠且高效的每日任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过将地址复制到多个位置来实现,例如降低[[延迟]]和增强[[弹性]]。由于[[任播]]在现代[[互联网]]中的关键作用,先前研究引入了执行任播普查的工具。首个工具[[iGreedy]]利用地理分散位置的延迟测量来映射任播部署;第二个工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查,但存在[[准确性]]和[[精确性]]问题。相反,iGreedy精度极高但速度较慢,且[[探测]]成本更高。 本文针对这两个系统的缺陷,提出了[[MAnycast Reloaded]](MAnycastR)。以MAnycast2为基础,我们彻底重构了其测量[[流水线]],新增[[分布式探测]]支持、额外[[协议]]([[UDP]]、[[TCP]]和[[IPv6]])支持,以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播[[测试平台]]上验证MAnycastR,对比外部任播[[生产部署]],通过[[RIPE Atlas]]进行广泛延迟测量,并将检测到的60%以上任播[[前缀]]与[[运营商]]真实数据交叉核验。结果表明MAnycastR实现了高准确性和精确性。我们以宽松[[开源协议]]向[[社区]]提供每日持续的MAnycastR普查数据,并公开[[工具]][[源代码]]。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重构动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成了任何社会的结构性支柱。它们通过协调地球上几乎每一个个体,形成了为所有人生产一切的社会[[新陈代谢系统]]。SCN绝非静态存在,而是通过[[企业]]的进出和[[供应关系]]的[[重组]]持续演变。本研究利用独特[[数据集]]追踪了一个国家SCN中企业及其[[供应商]]-[[客户关系]]的[[时间演化]]。基于[[匈牙利]]2014至2022年每月报告的[[增值税]]数据,我们重建了包含711,248家企业和38,644,400条连接的完整[[经济网络]],以[[企业级分辨率]]捕捉了整个[[经济体]]的每次[[重构事件]]。研究发现:每年约25%的企业退出SCN,同时28%的新企业加入;平均55%的现存[[供应链接]]会在次年消失;供应链接的[[半衰期]]为13个月。新链接以[[超偏好方式]]依附企业,概率满足$p(i)\propto k_i^{1.08}$($k_i$表示企业i的供应连接数)。我们校准了一个能复现匈牙利主导SCN典型特征的简易[[统计网络生成模型]],该模型不仅再现了[[入/出度分布]]、[[同配性]]和[[聚类结构]]等局部[[网络特征]],还捕捉了真实的[[系统性风险]]轮廓。最后探讨了[[经济重连动态]]对量化[[系统韧性]]和估计[[冲击传导]]的关键作用。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数极大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':我们研究一维[[高斯分布|高斯]][[位置混合模型|位置混合]]的[[非参数统计|非参数]][[最大似然估计|最大似然估计量]]$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定一个$n$点[[数据集]],该估计量总是返回最多包含$n$个分量的[[混合分布]],而最近(Wu-Polyanskiy, 2020)对[[亚高斯分布|亚高斯数据]]给出了严格的$O(\log n)$界。本文研究$\widehat{\pi}$的[[计算复杂性|计算特性]]:我们提出一种[[算法]],当$\varepsilon>0$足够小时,可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算出[[Wasserstein距离]]意义上的$\varepsilon$[[近似解]]$\widehat\pi$。其中$K$与数据相关但与$\varepsilon$无关,$C$为[[绝对常数]],$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的[[原子测度|原子]]数量。我们还可在有限时间内[[确定性算法|确定性]]计算出$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有[[概率密度函数|密度]](相对于[[Lebesgue测度]])的[[概率分布]]独立采样时,这些保证[[几乎必然|几乎必然成立]]。我们还证明:当$\widehat\pi$被约束为$k$原子分布时,其在相关$2k-1$维[[参数空间]]上存在密度(对所有$k\leq \sqrt{n}/3$成立),且[[EM算法]]几乎必然具有[[收敛速度|局部线性收敛性]]。关键工具之一是对[[非退化曲线]]的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子势的聚合物电解质膜质子传输大规模长时间原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习原子间势]]([[MLIPs]])作为一种能够实现大规模、长时间[[原子尺度模拟]]的方法,同时保持与基于[[密度泛函理论]]([[DFT]])和[[第一性原理]][[波函数理论]]的[[电子结构计算]]相当的精度,引起了广泛关注。然而,基于[[MLIP]]的[[分子动力学]]([[MD]])模拟面临的挑战是其稳定性低于使用传统[[经典势]]的模拟。分析高度异质体系或[[非晶材料]]通常需要大规模和长时间的模拟,因此需要开发能够实现稳定[[MD模拟]]的鲁棒[[MLIPs]]。在本研究中,我们利用[[神经网络势]]([[NNP]])生成器,构建了一个[[NNP模型]],能够在广泛[[水合水平]]范围内对[[全氟离聚物膜]]([[Nafion]])进行大规模、长时间的[[MD模拟]]。通过[[主动学习]]循环迭代扩展数据集,我们成功建立了鲁棒的[[深度势]]([[DP]])模型。具体而言,通过将非平衡[[DPMD模拟]]采样的非平衡结构与结合最小[[原子间距]]的三维[[结构特征空间]]中的结构筛选相结合,可以显著增强[[DP模型]]的鲁棒性,从而实现对约10,000至20,000个原子的大型[[Nafion体系]]进行长达31 ns的稳定[[MD模拟]]。采用所开发[[DP模型]]的[[MD模拟]]得到的[[氢原子]][[自扩散系数]],在广泛[[水合水平]]范围内与[[实验值]]更为吻合,优于先前对小体系进行的[[第一性原理]][[MD模拟]]结果。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':基于属性图的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':摘要:给定[[图]]$G$和[[种子节点]]$v_s$,[[局部图聚类]](LGC)的目标是在与$C_s$大小近似线性相关的时间内,识别出围绕$v_s$的[[子图]]$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图]]的[[应用场景]]。然而,现有解决方案大多仅依赖图中节点的[[拓扑连接性]],容易受到现实图数据中普遍存在的[[缺失]]或[[噪声链接]]的影响。为解决该问题,本文利用[[图拓扑]]与[[节点属性]]的互补特性来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将LGC建模为[[双向扩散分布]](BDD)的估计问题,该模型专门用于捕捉含属性节点的[[多跳关联性]]。进一步提出[[LACA]]方法——一种高效且具备严格[[理论保证]]的LGC解决方案:其核心包括(i)基于理论基础的快速[[节点属性预处理]]技术;(ii)具备加速收敛特性的自适应[[图向量扩散]]算法;(iii)BDD近似计算的[[三步优化方案]]。在8个[[真实数据集]]上与17种[[对比方法]]的实验表明,LACA在[[真实局部簇]]的[[评估指标]]上全面超越现有方法,同时实现数量级的[[速度提升]]。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:一个开放、快速、可靠且高效的每日任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过在多位置复制地址来实现降低[[延迟]]和增强[[韧性]]等目标。由于[[任播]]在现代[[互联网]]中的关键作用,先前研究已开发了执行任播普查的工具。首个工具[[iGreedy]]利用地理分散位置的延迟测量来绘制任播部署图;第二个工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度,可在3小时内完成全网普查,但存在[[准确性]]和[[精确度]]问题。相反,iGreedy精度极高但速度较慢,且探测成本更高。 本文针对这两个系统的缺陷提出了[[MAnycast Reloaded]](MAnycastR)。以MAnycast2为基础,我们彻底重新设计了其测量流程,新增[[分布式探测]]支持、额外[[协议]]([[UDP]]、[[TCP]]和[[IPv6]])支持以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR,与外部任播生产部署进行对比,并通过[[RIPE Atlas]]进行广泛延迟测量,同时将检测到的60%以上任播前缀与[[运营商]]真实数据交叉核验。结果表明MAnycastR实现了高准确性和精确度。我们将持续提供每日MAnycastR普查数据,并以宽松[[开源协议]]发布该工具的[[源代码]]。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重连动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成了任何[[社会]]的[[结构性支柱]]。它们通过协调[[地球]]上几乎每一个[[个体]],形成了为所有人生产一切的[[社会代谢系统]]。SCN绝非[[静态存在]],而是通过[[企业]]的进出与[[供应关系]]的[[重组]]持续[[演变]]。本研究利用独特[[数据集]]追踪了一个[[国家]]SCN中企业及其供需关系的[[时序演化]]。基于[[匈牙利]]2014至2022年按月申报的[[增值税]]数据,我们重建了包含711,248家企业和38,644,400条连接的[[整体经济网络]],以[[企业级分辨率]]覆盖了近乎所有[[经济重构事件]]。研究发现:每年约25%的企业退出SCN,同时28%的[[新企业]]加入;平均55%的年度供应关系会在次年消失;供应关系的[[半衰期]]为13个月。新连接以[[超偏好依附]]方式链接企业,概率满足$p(i)\propto k_i^{1.08}$($k_i$表示企业$i$的连接数)。我们校准的简易[[统计网络]]生成模型成功复现了匈牙利主导SCN的特征模式,不仅匹配[[入/出度分布]]、[[同配性]]和[[聚类结构]]等[[局部特征]],还能捕捉真实的[[系统性风险]]轮廓。该模型揭示了[[经济重连动态]]对量化[[系统韧性]]和评估[[冲击传导]]的关键作用。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数极大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':我们研究一维[[高斯分布|高斯]]位置混合的[[非参数统计|非参数]][[极大似然估计|极大似然估计量]]$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定n个[[数据点]]时该估计量总是返回最多含n个分量的[[混合分布]],而近期(Wu-Polyanskiy, 2020)对[[亚高斯分布|亚高斯数据]]给出了精确的$O(\log n)$界。本文研究$\widehat{\pi}$的[[计算复杂性|计算特性]]:提出一种[[算法]],当$\varepsilon>0$足够小时,可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算得到[[Wasserstein距离]]意义上的$\varepsilon$[[近似解]],其中$K$依赖数据但独立于$\varepsilon$,$C$为[[绝对常数]],$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的[[原子测度|原子数]]。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$来自具有[[Lebesgue测度]][[概率密度函数|密度]]的[[概率分布]]时,这些保证几乎必然成立。同时证明:当$k\leq \sqrt{n}/3$时,限定为k原子分布的$\widehat\pi$在其$2k-1$维[[参数空间]]上存在密度,且[[EM算法]]几乎必然具有[[收敛速度|局部线性收敛性]]。关键工具之一是对[[非退化曲线]]的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习原子间势]]([[MLIPs]])作为一种能够实现大规模、长时间[[原子尺度模拟]]的方法备受关注,同时保持与基于[[密度泛函理论]]([[DFT]])和[[从头算波函数理论]]的[[电子结构计算]]相当的精度。然而,基于[[MLIP]]的[[分子动力学]]([[MD]])模拟面临的一个挑战是,与传统[[经典势]]相比其稳定性较低。分析高度异质体系或[[非晶材料]]通常需要大规模和长时间的模拟,因此有必要开发能够实现稳定[[MD模拟]]的鲁棒性[[MLIP]]。在本研究中,我们利用自研的[[神经网络势]]([[NNP]])生成器,构建了一个[[NNP模型]],能够对[[全氟离聚物膜]]([[Nafion]])在不同[[水合水平]]下进行大规模、长时间的[[MD模拟]]。通过[[主动学习]]循环迭代扩展数据集,我们成功建立了鲁棒的[[深度势]]([[DP]])模型。具体而言,通过将非平衡[[DPMD]]模拟采样的非平衡结构与结合最小[[原子间距]]的三维[[结构特征空间]]中的结构筛选相结合,可以显著增强[[DP模型]]的鲁棒性,从而实现对约10,000至20,000个[[原子]]的大型[[Nafion]]体系进行长达31 ns的稳定[[MD模拟]]。采用所开发[[DP模型]]的[[MD模拟]]获得的[[氢原子]]自[[扩散系数]],在广泛的[[水合水平]]范围内比先前对小体系进行的[[从头算MD模拟]]更接近[[实验值]]。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':基于属性图的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':给定[[属性图]]$G$和[[种子节点]]$v_s$,[[局部图聚类]](LGC)的目标是在与$C_s$规模大致成线性关系的时间内,识别出围绕$v_s$的[[子图]]$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图]]的[[应用场景]]。然而现有方案大多仅依赖图中节点的[[拓扑连接性]],容易受到现实[[图谱]]中普遍存在的[[缺失链接]]或[[噪声链接]]的影响。 为解决该问题,本文利用[[图拓扑]]与[[节点属性]]的[[互补特性]]来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将LGC建模为[[双向扩散分布]](BDD)的[[估计问题]],该模型专门用于捕捉含属性节点的[[多跳关联性]]。进一步提出[[LACA]]方法——一种高效且具备强[[局部性]]的LGC解决方案,在多个[[真实数据集]]上展现出卓越性能。其核心组件包括:(i) 基于[[理论基础]]的快速[[节点属性预处理]]技术;(ii) 具有严格[[理论保证]]和[[加速收敛]]特性的[[自适应向量扩散算法]];(iii) 高效的[[三步式BDD近似方案]]。通过在8个[[真实数据集]]上与17种[[对比方法]]的实验表明,LACA在[[真实局部簇]]的[[衡量标准]]下结果质量最优,同时速度可提升数个[[数量级]]。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:一个开放、快速、可靠且高效的每日任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过在多位置复制地址来实现降低[[延迟]]和增强[[韧性]]等目标。由于任播在现代[[互联网]]中的关键作用,先前研究已开发了执行任播普查的工具。首个工具[[iGreedy]]利用地理分散位置的延迟测量来绘制任播部署图;第二个工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度,能在3小时内完成全网普查,但存在[[准确性]]和[[精确性]]问题。反之,iGreedy精度极高但速度较慢,且探测成本更高。 本文针对这两个系统的缺陷,提出了[[MAnycast Reloaded]](MAnycastR)。以MAnycast2为基础,我们彻底重新设计了其测量流程,新增[[分布式探测]]支持、额外[[协议]]([[UDP]]、[[TCP]]和[[IPv6]])支持以及类似iGreedy的延迟测量功能。我们在含32个全球分布节点的任播[[测试平台]]上验证MAnycastR,与外部任播[[生产部署]]进行对比,并通过[[RIPE Atlas]]进行广泛延迟测量,同时将检测到的60%以上任播[[前缀]]与[[运营商]]真实数据交叉验证。结果表明MAnycastR实现了高准确性和精确度。我们以宽松[[开源许可]]向[[社区]]提供每日持续的MAnycastR普查数据,并发布该工具的[[源代码]]。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重构动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成了任何[[社会]]的[[结构性支柱]]。它们通过协调[[地球]]上几乎每一个[[个体]],形成了为所有人生产一切的[[社会新陈代谢系统]]。[[供应链网络]]绝非[[静态存在]],而是通过[[企业]]的[[进入退出]]与[[供应关系]]的持续[[重组]]经历着[[永久性变化]]。本文利用独特[[数据集]]研究了一个[[国家]][[供应链网络]]中[[企业]]及其[[供应商]]-[[采购商]]关系的[[时间演化]]。基于[[匈牙利]]2014至2022年按月申报的[[增值税]]数据,我们重建了包含711,248家[[企业]]和38,644,400条[[连接关系]]的完整[[经济网络]],实现了[[企业级分辨率]]下整个[[经济体]]几乎所有[[重构事件]]的覆盖。研究发现:每年约25%的[[企业]]退出[[供应链网络]],同时28%的[[新企业]]进入;平均而言,当年存在的[[供应链接]]中有55%会在次年消失;[[供应链接]]的[[半衰期]]为13个月。[[新链接]]以[[超偏好依附]]方式连接[[企业]],概率满足$p(i)\propto k_i^{1.08}$($k_i$表示[[企业]]$i$的[[供应连接]]数)。我们校准了一个能复现[[匈牙利]]主导[[供应链网络]][[典型特征]]的简易[[统计网络]][[生成模型]],该模型不仅再现了[[入/出度分布]]、[[同配性]]和[[聚类结构]]等[[局部网络特征]],还捕捉到真实的[[系统性风险]]特征。最后探讨了[[经济网络]][[重连动态]]对量化[[系统韧性]]和估计[[冲击传导]]的[[关键作用]]。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数最大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':我们研究一维[[高斯分布|高斯]][[位置混合模型]]的[[非参数统计|非参数]][[最大似然估计]]量$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定n个[[数据点]]时该估计量总是返回最多含n个分量的混合模型,而近期(Wu-Polyanskiy, 2020)对[[亚高斯分布|亚高斯]][[数据]]给出了精确的$O(\log n)$界。本文研究$\widehat{\pi}$的计算特性:我们提出的[[算法]]能在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算[[Wasserstein距离]]意义上的$\varepsilon$[[近似解]],其中$K$与$\varepsilon$无关但依赖数据,$C$为[[绝对常数]],$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的[[原子]]数量。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$来自具有[[概率密度函数|密度]](相对于[[Lebesgue测度]])的[[概率分布]]时,这些保证几乎必然成立。我们进一步证明:当$\widehat\pi$被约束为k原子分布时,其在$2k-1$维[[参数空间]]上存在密度(对所有$k\leq \sqrt{n}/3$成立),且[[EM算法]]几乎必然具有[[收敛速度|局部线性收敛性]]。关键工具之一是针对[[非退化曲线]]的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子间势的聚合物电解质膜质子传输大规模长时原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习原子间势]]([[MLIPs]])作为一种能够实现大规模、长时间[[原子尺度模拟]]的方法,同时保持与基于[[密度泛函理论]]([[DFT]])和[[从头算波函数理论]]的[[电子结构计算]]相当的精度,引起了广泛关注。然而,基于[[MLIP]]的[[分子动力学]]([[MD]])模拟面临的一个挑战是,与传统[[经典势]]相比其稳定性较低。分析高度异质体系或[[非晶材料]]通常需要大规模和长时间的模拟,因此需要开发能够实现稳定[[MD模拟]]的鲁棒[[MLIP]]。在本研究中,我们利用[[神经网络势]]([[NNP]])生成器,构建了一个[[NNP模型]],能够在广泛水合水平下对[[全氟离聚物膜]]([[Nafion]])进行大规模、长时间的[[MD模拟]]。通过[[主动学习]]循环迭代扩展数据集,我们成功建立了鲁棒的[[深度势]]([[DP]])模型。具体而言,通过将非平衡[[DPMD]]模拟采样的非平衡结构与结合最小原子间距的[[三维结构特征空间]]中的结构筛选相结合,可以显著增强[[DP模型]]的鲁棒性,从而实现对约10,000至20,000个原子的大型[[Nafion]]体系进行长达31 ns的稳定[[MD模拟]]。采用所开发[[DP模型]]的[[MD模拟]]获得的[[氢原子]]自扩散系数,在广泛水合水平范围内与实验值更为吻合,优于先前对小体系进行的[[从头算MD模拟]]结果。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':基于属性图的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':给定[[图]]$G$和[[种子节点]]$v_s$,[[局部图聚类]](LGC)的目标是在与$C_s$大小近似线性相关的时间内,识别出围绕$v_s$的[[子图]]$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图]]的[[应用场景]]。然而现有方案大多仅依赖图中节点的[[拓扑连接性]],容易受到现实[[图谱]]中普遍存在的[[缺失]]或[[噪声链接]]的影响。 为解决该问题,本文利用[[图拓扑]]与[[节点属性]]的[[互补特性]]来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将LGC建模为[[双向扩散分布]](BDD)的估计问题,该模型专门用于捕捉含属性节点间的[[多跳关联]]。进一步提出[[LACA]]方法——一种高效且具备严格[[理论保证]]的[[LGC]]方案:其核心包括(i)基于[[理论基础]]的快速[[节点属性预处理]]技术;(ii)具备[[加速收敛]]特性的[[自适应图向量扩散]]算法;(iii)[[BDD]]近似计算的[[三步优化框架]]。在8个[[真实数据集]]上与17种[[基线方法]]的对比实验表明,LACA在真实[[局部簇]]的[[衡量标准]]下全面优于所有对比方法,同时实现[[数量级]]的[[速度提升]]。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:一个开放、快速、可靠且高效的每日任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过在多位置复制地址来实现降低[[延迟]]和增强[[韧性]]等目标。由于任播在现代[[互联网]]中的关键作用,先前研究已开发了执行任播普查的工具。首个工具[[iGreedy]]利用地理分散位置的延迟测量来绘制任播部署图;第二个工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查,但存在[[准确性]]和[[精确性]]问题。相反,iGreedy精度极高但速度较慢,且[[探测成本]]更高。 本文针对这两个系统的缺陷提出了[[MAnycast Reloaded]](MAnycastR)。以MAnycast2为基础,我们彻底重构了其测量流程,新增[[分布式探测]]支持、额外[[协议]]([[UDP]]、[[TCP]]和[[IPv6]])支持以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播[[测试平台]]上验证MAnycastR,与外部任播[[生产部署]]对比,并通过[[RIPE Atlas]]进行广泛延迟测量,同时对检测到的60%以上任播[[前缀]]进行[[运营商]]数据交叉验证。结果表明MAnycastR实现了高准确性与精确度。我们将持续提供每日MAnycastR普查数据,并以宽松[[开源协议]]发布工具[[源代码]]。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重构动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成了任何[[社会]]的[[结构性支柱]]。它们通过协调[[地球]]上几乎每一个[[个体]],形成了为所有人生产一切的[[社会新陈代谢系统]]。供应链网络绝非[[静态存在]],而是通过[[企业]]的进出与[[供应关系]]的[[重组]]持续[[演变]]。本研究利用独特[[数据集]]追踪了一个[[国家]]供应链网络中企业及其[[供应商]]-[[客户关系]]的[[时间演化]]。基于[[匈牙利]]2014至2022年按月申报的[[增值税]]数据,我们重构了包含711,248家企业和38,644,400条连接的完整[[经济网络]],以企业级[[分辨率]]捕捉了整个[[经济体]]的几乎每次[[重构事件]]。研究发现:每年约25%的企业退出供应链网络,同时28%的[[新企业]]加入;平均55%的现存供应关系会在次年消失;供应关系的[[半衰期]]为13个月。新连接以超[[偏好依附]]概率$p(i)\propto k_i^{1.08}$($k_i$表示企业i的[[供应连接]]数)与企业建立关联。我们校准了一个能复现匈牙利主导供应链网络典型特征的简易[[统计网络]]生成模型,该模型不仅再现了[[入/出度分布]]、[[同配性]]和[[聚类结构]]等[[局部网络]]特征,还捕捉了真实的[[系统性风险]]轮廓。最后探讨了[[经济网络]]重连动态对量化[[系统韧性]]和估计[[冲击传导]]的关键作用。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数极大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':我们研究一维[[高斯分布|高斯]][[位置混合模型]]的[[非参数统计|非参数]][[最大似然估计]]量$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定包含$n$个[[数据点]]的[[数据集]],该估计量始终返回最多包含$n$个[[混合模型|分量]]的混合模型,而近期(Wu-Polyanskiy, 2020)对[[次高斯分布|次高斯数据]]给出了严格的$O(\log n)$界。本文重点研究$\widehat{\pi}$的[[计算复杂性|计算特性]]:我们提出一种[[算法]],当$\varepsilon>0$足够小时,可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算出[[Wasserstein距离]]意义上的$\varepsilon$[[近似解]]$\widehat\pi$。其中$K$与数据相关但与$\varepsilon$无关,$C$为[[绝对常数]],$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的[[原子(测度论)|原子]]数量。我们还可在有限时间内确定性计算出$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$中的点独立采样自具有(相对于[[勒贝格测度]]的)[[概率密度函数|密度函数]]的[[概率分布]]时,这些保证几乎必然成立。我们还证明:当$\widehat\pi$被约束为$k$原子分布时,对于所有$k\leq \sqrt{n}/3$的情况,其在相关$2k-1$维[[参数空间]]上存在密度函数,且[[EM算法]]几乎必然具有[[收敛速度|局部线性收敛性]]。关键工具之一是对[[非退化曲线]]的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习原子间势]]([[MLIPs]])作为一种能够实现大规模、长时间[[原子模拟]]的方法备受关注,同时保持与基于[[密度泛函理论]]([[DFT]])和[[从头算波函数理论]]的[[电子结构计算]]相当的精度。然而,基于[[MLIP]]的[[分子动力学]]([[MD]])模拟面临的一个挑战是,与传统[[经典势]]相比其稳定性较低。分析高度异质体系或[[非晶材料]]通常需要大规模和长时间的模拟,因此有必要开发能够实现稳定[[MD模拟]]的鲁棒[[MLIPs]]。在本研究中,我们利用[[神经网络势]]([[NNP]])生成器,构建了一个[[NNP模型]],该模型能够对[[全氟离聚物膜]]([[Nafion]])在不同[[水合水平]]下进行大规模、长时间的[[MD模拟]]。通过[[主动学习]]循环迭代扩展数据集,我们成功建立了一个鲁棒的[[深度势]]([[DP]])模型。具体而言,通过将[[非平衡]][[DPMD模拟]]采样的非平衡结构与结合[[最小原子间距离]]的[[三维结构特征空间]]中的结构筛选相结合,可以显著增强[[DP模型]]的鲁棒性,从而实现对约10,000至20,000个原子的大型[[Nafion体系]]进行长达31 ns的稳定[[MD模拟]]。采用所开发[[DP模型]]的[[MD模拟]]获得的[[氢原子]][[自扩散系数]],在广泛[[水合水平]]范围内与[[实验值]]更为吻合,优于先前对小体系进行的[[从头算MD模拟]]结果。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':属性图上的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':摘要:给定[[图]]$G$和[[种子节点]]$v_s$,[[局部图聚类]](LGC)的目标是在与$C_s$大小大致成线性关系的时间内,识别出围绕$v_s$的[[子图]]$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],因此非常适用于涉及[[大规模图]]的[[应用场景]]。然而,现有解决方案大多仅依赖图中节点的[[拓扑连接性]],容易受到现实图数据中普遍存在的[[缺失]]或[[噪声链接]]的影响。为解决这一问题,本文利用[[图拓扑]]与[[节点属性]]的互补特性来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将LGC建模为[[双向扩散分布]](BDD)的估计问题,该模型专门用于捕捉带属性节点的[[多跳关联性]]。进一步提出[[LACA]]方法——一种高效且具备严格[[理论保证]]的LGC方案,其核心组件包括:(i)快速且理论完备的[[节点属性预处理]]技术;(ii)具有[[理论收敛]]保证的[[自适应向量扩散]]算法;(iii)高效的[[三步式BDD近似]]框架。在8个[[真实数据集]]上与17种[[基线方法]]的对比实验表明,LACA在[[真实局部簇]]的[[评估指标]]上全面优于所有对比方法,同时[[速度提升]]可达[[数量级]]。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:开放、快速、可靠且高效的日常任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过在多位置复制地址来实现降低[[延迟]]和增强[[韧性]]等目标。由于[[任播]]在现代[[互联网]]中的关键作用,先前研究已开发了执行任播普查的工具。首个工具[[iGreedy]]利用地理分散位置的延迟测量来映射任播部署;第二个工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查,但存在[[准确性]]和[[精确性]]问题。反之,iGreedy精度极高但速度较慢,且探测成本更高。 本文针对这两个系统的缺陷,提出了[[MAnycast Reloaded]]([[MAnycastR]])。以MAnycast2为基础,我们彻底重新设计了其测量流程,新增[[分布式探测]]支持、额外[[协议]]([[UDP]]、[[TCP]]和[[IPv6]])支持,以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR,与外部任播生产部署进行对比,通过[[RIPE Atlas]]进行广泛延迟测量,并对检测到的60%以上任播前缀进行[[运营商]]数据交叉验证。结果表明MAnycastR实现了高准确性与精确性。我们将持续提供每日MAnycastR普查数据,并以宽松[[开源协议]]发布工具[[源代码]]。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重构动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成了任何[[社会]]的[[结构性支柱]]。它们通过协调[[地球]]上几乎每一个[[个体]],形成了为所有人生产一切的[[社会新陈代谢系统]]。SCN绝非[[静态存在]],而是通过[[企业]]的进出与[[供应关系]]的[[重组]]持续[[演变]]。本研究利用独特[[数据集]]追踪了一个[[国家]]供应链网络中企业及其[[供应商-客户关系]]的[[时间演化]]。基于[[匈牙利]]2014至2022年按月申报的[[增值税]]数据,我们重构了包含711,248家企业和38,644,400条连接的完整[[经济网络]],以[[企业级分辨率]]捕捉了整个[[经济体]]的每次[[重构事件]]。研究发现:每年约25%的企业退出SCN,同时28%的[[新企业]]加入;平均55%的现存[[供应链接]]会在次年消失;供应链接的[[半衰期]]为13个月。新链接以[[超偏好依附]]概率$p(i)\propto k_i^{1.08}$($k_i$表示企业i的[[供应连接数]])附着于企业。我们校准了一个能复现匈牙利主导SCN典型特征的简易[[统计网络生成模型]],该模型不仅再现了[[入/出度分布]]、[[同配性]]和[[聚类结构]]等[[局部网络特征]],还捕捉了真实的[[系统性风险]]轮廓。最后探讨了[[经济重连动态]]对量化[[系统韧性]]和估计[[冲击传导]]的关键作用。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数最大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':我们研究一维[[高斯分布|高斯]]位置混合的[[非参数统计|非参数]][[极大似然估计]]量$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定n个[[数据点]]时该估计量总是返回最多含n个分量的[[混合分布]],而近期(Wu-Polyanskiy, 2020)对[[次高斯分布|次高斯]][[数据]]给出了尖锐的$O(\log n)$界。本文研究$\widehat{\pi}$的计算特性:针对足够小的$\varepsilon>0$,我们提出一个[[算法]]可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算[[Wasserstein距离]]意义上的$\varepsilon$[[近似解]],其中$K$与数据相关但与$\varepsilon$无关,$C$为[[绝对常数]],$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的[[原子数]]。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有[[密度函数]](相对于[[Lebesgue测度]])的[[概率分布]]独立采样时,这些保证几乎必然成立。我们进一步证明:当$k\leq \sqrt{n}/3$时,限定为k原子分布的$\widehat\pi$条件分布在相应$2k-1$维[[参数空间]]上存在密度函数,且[[EM算法]]几乎必然具有局部[[线性收敛]]性。关键工具之一是关于[[非退化曲线]]的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习原子间势]]([[MLIPs]])作为一种能够实现大规模、长时间[[原子尺度]]模拟的方法,同时保持与基于[[密度泛函理论]]([[DFT]])和[[第一性原理]][[波函数理论]]的[[电子结构计算]]相当的精度,引起了广泛关注。然而,基于[[MLIP]]的[[分子动力学]]([[MD]])模拟面临的一个挑战是,与使用传统[[经典势]]的模拟相比,其[[稳定性]]较低。分析高度[[异质体系]]或[[非晶材料]]通常需要大规模和长时间的模拟,因此需要开发能够实现稳定[[MD模拟]]的鲁棒[[MLIPs]]。在本研究中,我们利用[[神经网络势]]([[NNP]])生成器,构建了一个[[NNP模型]],能够在广泛[[水合水平]]范围内对[[全氟离聚物膜]]([[Nafion]])进行大规模、长时间的[[MD模拟]]。通过[[主动学习]]循环迭代扩展[[数据集]],我们成功构建了一个鲁棒的[[深度势]]([[DP]])模型。具体而言,通过将[[非平衡]][[DPMD]]模拟采样的[[非平衡结构]]与结合[[最小原子间距离]]的[[三维结构]][[特征空间]]中的[[结构筛选]]相结合,可以显著增强[[DP模型]]的[[鲁棒性]],从而实现对约10,000至20,000个[[原子]]的大型[[Nafion体系]]进行长达31 ns的稳定[[MD模拟]]。采用所开发[[DP模型]]的[[MD模拟]]得到的[[氢原子]][[自扩散系数]],与先前较小体系的[[第一性原理]][[MD模拟]]相比,在广泛[[水合水平]]范围内更接近[[实验值]]。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':基于属性图的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':摘要:给定[[图]]$G$和[[种子节点]]$v_s$,[[局部图聚类]](LGC)的目标是在与$C_s$大小近似线性相关的时间内,识别出围绕$v_s$的[[子图]]$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],因此非常适用于涉及[[大规模图]]的[[应用场景]]。然而,现有解决方案大多仅依赖图中节点的[[拓扑连接性]],容易受到现实图数据中普遍存在的[[缺失]]或[[噪声链接]]的影响。为解决该问题,本文利用[[图拓扑]]与[[节点属性]]的互补特性来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将LGC建模为[[双向扩散分布]](BDD)的估计问题,该模型专门用于捕捉带属性节点的[[多跳亲和度]]。进一步提出[[LACA]]方法——一种高效且具备严格[[理论保证]]的LGC解决方案:其核心包括(i)基于理论基础的快速[[节点属性预处理]]技术;(ii)具备理论保证且加速收敛的[[自适应向量扩散算法]];(iii)BDD近似计算的[[三步高效方案]]。在8个[[真实数据集]]上与17种[[对比方法]]的实验表明,LACA在[[真实局部簇]]的衡量标准下均优于所有[[基线方法]],同时速度提升达[[数量级]]。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:一个开放、快速、可靠且高效的每日任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过在多位置复制地址来实现降低[[延迟]]和增强[[韧性]]等目标。由于任播在现代[[互联网]]中的关键作用,先前研究已开发了执行任播普查的工具。首个工具[[iGreedy]]利用地理分散位置的延迟测量来绘制任播部署图;第二个工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——仅需3小时即可完成全网普查,但存在[[准确性]]和[[精确度]]问题。反之,iGreedy精度极高但速度较慢,且探测成本显著更高。 本文针对这两个系统的缺陷提出了[[MAnycast Reloaded]](MAnycastR)。基于MAnycast2框架,我们彻底重构了其测量流程,新增[[分布式探测]]支持、额外[[协议]]([[UDP]]、[[TCP]]和[[IPv6]])支持以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR,对比实际任播生产部署,并通过[[RIPE Atlas]]进行大规模延迟测量,同时对检测到的60%以上任播前缀进行[[运营商]]数据交叉核验。结果表明MAnycastR实现了高准确性与精确度。我们将持续提供每日MAnycastR普查数据,并以宽松[[开源协议]]发布工具[[源代码]]。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':属性图上的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':摘要:给定[[图]]$G$和[[种子节点]]$v_s$,[[局部图聚类]](LGC)的目标是在与$C_s$大小大致成线性关系的时间内,识别出围绕$v_s$的[[子图]]$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图]]的[[应用场景]]。然而,现有解决方案大多仅依赖图中节点的[[拓扑连接性]],容易受到现实图数据中普遍存在的[[缺失]]或[[噪声链接]]的影响。为解决这一问题,本文利用[[图拓扑]]与[[节点属性]]的互补特性来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将LGC建模为[[双向扩散分布]](BDD)的估计问题,该模型专门用于捕捉带属性节点的[[多跳关联性]]。进一步提出[[LACA]]方法——一种高效且具备严格[[理论保证]]的LGC解决方案:其核心包括(i)基于理论基础的快速[[节点属性预处理]]技术;(ii)具有[[理论收敛]]保证的[[自适应图向量扩散]]算法;(iii)高效的[[三步式BDD近似]]方案。在8个[[真实数据集]]上与17种[[基线方法]]的对比实验表明,LACA在[[真实局部簇标准]]下的结果质量显著优于所有对比方法,同时速度可提升数个数量级。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重连动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成任何[[社会]]的[[结构性支柱]]。它们通过协调[[地球]]上几乎每一个[[个体]],形成了为所有人生产一切的[[社会代谢系统]]。供应链网络绝非[[静态存在]],而是通过[[企业]]的进出与[[供应关系]]的[[重组]]持续[[演变]]。本研究利用独特[[数据集]]追踪了一个[[国家]]供应链网络中企业及其[[供应商]]-[[客户关系]]的[[时间演化]]。基于[[匈牙利]]2014至2022年按月申报的[[增值税]]数据,我们重构了包含711,248家企业和38,644,400条连接的完整[[经济网络]],实现了[[企业级分辨率]]下整个[[经济体系]][[重组事件]]的完整捕捉。研究发现:每年约25%的企业退出供应链网络,同时28%的[[新企业]]进入;平均55%的现存[[供应链接]]会在次年消失;供应链接的[[半衰期]]为13个月。新链接以超[[偏好依附]]概率$p(i)\propto k_i^{1.08}$($k_i$表示企业i的[[供应连接数]])与企业建立连接。我们校准的简易[[统计网络]][[生成模型]]成功复现了匈牙利主导供应链网络的[[典型特征]],不仅能重现[[入/出度分布]]、[[同配性]]和[[聚类结构]]等[[局部网络特征]],还能捕捉真实的[[系统性风险]][[轮廓]]。最后探讨了该模型如何通过[[经济网络]]的[[重连动态]]来量化[[系统韧性]]并评估[[冲击传导]]。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数最大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':我们研究一维[[高斯分布|高斯]][[位置混合模型]]的[[非参数统计|非参数]][[最大似然估计]]量$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定n个[[数据点]]时,该估计量总是返回最多含n个[[混合模型]]的[[分量]];而近期(Wu-Polyanskiy, 2020)对[[次高斯分布|次高斯]][[数据]]给出了严格的$O(\log n)$界。本文重点研究$\widehat{\pi}$的[[计算复杂性|计算特性]]:我们提出一种[[算法]],当$\varepsilon>0$足够小时,可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算得到$\widehat\pi$的[[Wasserstein距离]]$\varepsilon$-[[近似解]]。其中$K$与[[数据]]相关但与$\varepsilon$无关,$C$为[[绝对常数]],$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的[[原子]]数量。我们还可在[[有限时间]]内[[确定性算法|确定性计算]]$|supp(\widehat\pi)|$的[[精确值]]。当[[数据集]]$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有[[密度函数]](相对于[[勒贝格测度]])的[[概率分布]]独立[[采样]]生成时,这些保证几乎必然成立。我们进一步证明:当$\widehat\pi$被约束为$k$[[原子分布]]时,其[[条件分布]]在对应的$2k-1$维[[参数空间]]上存在[[密度函数]](对所有$k\leq \sqrt{n}/3$成立),且[[EM算法]]几乎必然具有[[局部收敛性|局部线性收敛性]]。关键工具之一是对[[非退化曲线]]的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:一个开放、快速、可靠且高效的每日任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过在多位置复制地址来实现降低[[延迟]]和增强[[韧性]]等目标。由于任播在现代[[互联网]]中的关键作用,先前研究已开发了执行任播普查的工具。首个工具[[iGreedy]]利用地理分散位置的延迟测量来绘制任播部署图;第二个工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查,但存在[[准确性]]和[[精确性]]问题。反之,iGreedy精度极高但速度较慢,且探测成本更高。 本文针对这两个系统的缺陷提出了[[MAnycast Reloaded]](MAnycastR)。以MAnycast2为基础,我们彻底重构了其测量流水线,新增[[分布式探测]]支持、额外[[协议]]([[UDP]]、[[TCP]]和[[IPv6]])支持以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播[[测试平台]]上验证MAnycastR,与外部任播[[生产部署]]对比,并通过[[RIPE Atlas]]进行广泛延迟测量,同时针对60%以上检测到的任播[[前缀]]与[[运营商]]真实数据进行交叉验证。结果表明MAnycastR实现了高准确性与精确度。我们将持续提供每日MAnycastR普查数据,并以宽松[[开源协议]]发布工具[[源代码]]。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':属性图上的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':给定[[图]]$G$和[[种子节点]]$v_s$,[[局部图聚类]](LGC)的目标是在与$C_s$大小大致成线性关系的时间内,识别出围绕$v_s$的[[子图]]$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图]]的[[应用场景]]。然而现有方案大多仅依赖图中节点的[[拓扑连接性]],容易受到现实图数据中普遍存在的[[缺失]]或[[噪声链接]]的影响。 为解决该问题,本文利用[[图拓扑]]与[[节点属性]]的互补特性来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将LGC建模为[[双向扩散分布]](BDD)的估计问题,该模型专门用于捕捉含属性节点的[[多跳关联性]]。进一步提出[[LACA]]方法——一种高效且具备强[[局部性]]的LGC解决方案,在多个[[真实数据集]]上表现出卓越性能。其核心组件包括:(i)快速且理论完备的[[节点属性预处理]]技术;(ii)具有严格[[理论保证]]和[[加速收敛]]特性的[[自适应向量扩散算法]];(iii)高效的[[三步式BDD近似]]方案。通过在8个[[真实数据集]]上与17种[[对比方法]]的实验表明,LACA在[[真实局部簇]]的衡量标准下结果质量最优,同时速度可提升数个数量级。代码已开源在https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重构动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成了任何社会的结构性支柱。它们通过协调地球上几乎每一个个体,形成了为所有人生产一切的社会[[新陈代谢系统]]。供应链网络绝非静态,而是通过[[企业]]的进出和[[供应关系]]的[[重组]]不断变化。本文利用独特[[数据集]]研究了一个国家供应链网络中企业及其[[供应商]]-[[客户关系]]的时间演化。基于[[匈牙利]]2014至2022年每月报告的[[增值税]]数据,我们重建了包含711,248家企业和38,644,400条连接的[[整体经济网络]],以企业级分辨率覆盖了几乎整个[[经济体]]的所有[[重构事件]]。研究发现:每年约25%的企业退出供应链网络,同时28%的新企业加入;平均而言,当年存在的[[供应链接]]中有55%会在次年消失;供应链接的[[半衰期]]为13个月。新链接以超偏好概率$p(i)\propto k_i^{1.08}$依附企业($k_i$表示企业i的供应连接数)。我们校准了一个能复现匈牙利主导供应链网络典型特征的简单[[统计网络生成模型]],该模型不仅复现了[[入/出度分布]]、[[同配性]]和[[聚类结构]]等局部[[网络特征]],还捕捉了真实的[[系统性风险]]特征。最后讨论了当前模型如何通过[[经济重连动态]]来量化其[[韧性]]和估计[[冲击传导]]。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数极大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':我们研究一维[[高斯分布|高斯]][[位置混合模型|位置混合]]的[[非参数统计|非参数]][[极大似然估计|极大似然估计量]]$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定n个[[数据点]]时该估计量始终返回最多含n个[[混合分布|分量]]的混合分布,而近期(Wu-Polyanskiy, 2020)对[[亚高斯分布|亚高斯数据]]给出了严格的$O(\log n)$界。本文重点研究$\widehat{\pi}$的[[计算复杂性|计算特性]]:提出一种[[算法]],当$\varepsilon>0$足够小时,可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算得到$\widehat\pi$的[[Wasserstein距离]]$\varepsilon$-近似解。其中$K$与数据相关但与$\varepsilon$无关,$C$为[[绝对常数]],$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的[[原子测度|原子数]]。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有[[密度函数]](相对于[[Lebesgue测度]])的[[概率分布]]独立采样生成时,这些保证几乎必然成立。进一步证明:当$k\leq \sqrt{n}/3$时,限定为k原子分布的$\widehat\pi$条件分布在相应$2k-1$维[[参数空间]]上存在密度函数,且[[EM算法]]几乎必然具有[[收敛速度|局部线性收敛性]]。关键工具之一是[[非退化曲线]]的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:一个开放、快速、可靠且高效的每日任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过在多位置复制地址来实现降低[[延迟]]和增强[[韧性]]等目标。由于任播在现代[[互联网]]中的关键作用,先前研究已开发了执行任播普查的工具。首个工具[[iGreedy]]利用地理分散节点的延迟测量来绘制任播部署图;第二个工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查,但存在[[准确性]]和[[精确度]]问题。相反,iGreedy精度极高但速度较慢,且探测成本更高。 本文针对这两个系统的缺陷提出了[[MAnycast Reloaded]](MAnycastR)。以MAnycast2为基础,我们彻底重构了其测量管道,新增[[分布式探测]]支持、额外[[协议]]([[UDP]]、[[TCP]]和[[IPv6]])支持,以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR,对比实际任播生产部署,并通过[[RIPE Atlas]]进行大规模延迟测量,同时将检测到的60%以上任播前缀与[[运营商]]真实数据交叉核验。结果表明MAnycastR具备高准确性与精确度。我们将持续提供每日MAnycastR普查数据,并以宽松[[开源协议]]发布工具[[源代码]]。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习原子间势]]([[MLIPs]])作为一种能够实现大规模、长时间[[原子尺度模拟]]的方法,同时保持与基于[[密度泛函理论]]([[DFT]])和[[第一性原理]][[波函数理论]]的[[电子结构计算]]相当的精度,引起了广泛关注。然而,基于[[MLIP]]的[[分子动力学]]([[MD]])模拟面临的挑战是其稳定性低于使用传统[[经典势]]的模拟。分析高度异质体系或[[非晶材料]]通常需要大规模和长时间的模拟,因此需要开发能够实现稳定[[MD模拟]]的鲁棒[[MLIPs]]。在本研究中,我们利用自研的[[神经网络势]]([[NNP]])生成器,构建了一个[[NNP模型]],能够在广泛[[水合水平]]下对[[全氟离聚物膜]]([[Nafion]])进行大规模、长时间的[[MD模拟]]。通过[[主动学习]][[循环迭代]]扩展数据集,我们成功建立了鲁棒的[[深度势]]([[DP]])模型。具体而言,通过将[[非平衡]][[DPMD模拟]]采样的[[非平衡结构]]与结合[[最小原子间距]]的[[三维结构]][[特征空间]]中的[[结构筛选]]相结合,可显著提升[[DP模型]]的鲁棒性,从而实现对约10,000至20,000个原子的大型[[Nafion体系]]进行长达31 ns的稳定[[MD模拟]]。采用所开发[[DP模型]]的[[MD模拟]]获得的[[氢原子]][[自扩散系数]],在广泛[[水合水平]]范围内比先前小体系的[[第一性原理]][[MD模拟]]结果更接近[[实验值]]。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':基于属性图的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':给定[[图]]$G$和[[种子节点]]$v_s$,[[局部图聚类]](LGC)的目标是在与$C_s$大小大致成线性关系的时间内,识别出围绕$v_s$的[[子图]]$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图数据]]的众多[[应用场景]]。然而,现有解决方案大多仅依赖图中节点的[[拓扑连接]]关系,容易受到现实图数据中普遍存在的[[缺失链接]]或[[噪声链接]]的影响。 为解决这一问题,本文利用[[图拓扑]]与[[节点属性]]的互补特性来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将LGC问题建模为[[双向扩散分布]](BDD)的估计问题,该方法专门用于捕捉带属性节点的[[多跳关联性]]。进一步提出[[LACA算法]]——一种高效且具备强[[局部性]]的LGC解决方案,在多个[[真实数据集]]上展现出卓越性能。LACA的核心组件包括:(i)基于[[理论基础]]的快速[[节点属性预处理]]技术;(ii)具备严格[[理论保证]]和[[加速收敛]]特性的[[自适应向量扩散算法]];(iii)有效的BDD近似[[三步骤方案]]。通过在8个[[真实数据集]]上与17种[[对比方法]]的实验表明,LACA在真实[[局部簇]]的衡量标准下结果质量最优,同时速度可提升数个[[数量级]]。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重构动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成了任何[[社会]]的[[结构性支柱]]。它们通过协调[[地球]]上几乎每一个[[个体]],形成了为所有人生产一切的[[社会新陈代谢系统]]。[[供应链网络]]绝非[[静态存在]],而是通过[[企业]]的进出和[[供应关系]]的[[重组]]不断变化。本文利用独特[[数据集]]研究了一个[[国家]][[供应链网络]]中[[企业]]及其[[供应商]]-[[采购商]]关系的[[时间演化]]。基于[[匈牙利]]2014至2022年每月报告的[[增值税]]数据,我们重建了包含711,248家[[企业]]和38,644,400条[[连接]]的[[整体经济网络]],以[[企业级分辨率]]覆盖了几乎整个[[经济体]]的所有[[重构事件]]。研究发现:每年约25%的[[企业]]退出[[供应链网络]],同时28%的[[新企业]]加入;平均而言,当年存在的[[供应链接]]中有55%会在次年消失;[[供应链接]]的[[半衰期]]为13个月。[[新链接]]以[[超偏好概率]]$p(i)\propto k_i^{1.08}$依附[[企业]]($k_i$表示[[企业]]$i$的[[供应连接]]数)。我们校准了一个能复现[[匈牙利]]主导[[供应链网络]]典型特征的简单[[统计网络生成模型]],该模型不仅复现了[[入/出度分布]]、[[同配性]]和[[聚类结构]]等[[局部网络特征]],还捕捉了真实的[[系统性风险]]特征。最后讨论了当前[[模型]]如何通过[[经济重连动态]]来量化其[[韧性]]并评估[[冲击传导]]。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数极大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':我们研究一维[[高斯分布|高斯]][[位置混合模型]]的[[非参数统计|非参数]][[最大似然估计]]量$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定n个[[数据点]]时该估计量总是返回最多含n个分量的[[混合模型]],而近期(Wu-Polyanskiy, 2020)对[[亚高斯分布|亚高斯]][[数据]]给出了精确的$O(\log n)$界。本文重点研究$\widehat{\pi}$的[[计算复杂性|计算特性]]:提出一种[[算法]]能在足够小的$\varepsilon>0$时,以$K+Cnk^2\log\log(1/\varepsilon)$时间计算[[Wasserstein距离]]下的$\varepsilon$[[近似解]],其中$K$与数据相关但与$\varepsilon$无关,$C$为[[绝对常数]],$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的[[原子数]]。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$来自具有[[概率密度函数|密度]](相对于[[Lebesgue测度]])的[[概率分布]]时,这些保证几乎必然成立。同时证明:当$k\leq \sqrt{n}/3$时,限定为k原子分布的$\widehat\pi$在其$2k-1$维[[参数空间]]上存在密度,且[[EM算法]]几乎必然具有[[局部收敛性|局部线性收敛性]]。关键工具之一是对[[非退化曲线]]的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:一个开放、快速、可靠且高效的每日任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过在多位置复制地址来实现降低[[延迟]]和增强[[韧性]]等目标。由于[[任播]]在现代[[互联网]]中的关键作用,先前研究已开发了执行任播普查的工具。首个工具[[iGreedy]]利用地理分散节点的延迟测量来绘制任播部署图;第二个工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查,但存在[[准确性]]和[[精确性]]问题。相反,iGreedy精度极高但速度较慢,且探测成本更高。 本文针对这两个系统的缺陷提出了[[MAnycast Reloaded]](MAnycastR)。以MAnycast2为基础,我们彻底重构了其测量流水线,新增[[分布式探测]]支持、额外[[协议]]([[UDP]]、[[TCP]]和[[IPv6]])支持以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR,对比实际任播生产部署,并通过[[RIPE Atlas]]进行大规模延迟测量,同时将检测到的60%以上任播前缀与运营商真实数据进行交叉验证。结果表明MAnycastR具备高准确性和精确性。我们以宽松[[开源协议]]发布工具源代码,并向社区提供持续的每日MAnycastR普查数据。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习原子间势]]([[MLIPs]])作为一种能够实现大规模、长时间[[原子尺度模拟]]的方法,同时保持与基于[[密度泛函理论]]([[DFT]])和[[从头算波函数理论]]的[[电子结构计算]]相当的精度,引起了广泛关注。然而,基于[[MLIP]]的[[分子动力学]]([[MD]])模拟面临的挑战是其稳定性低于使用传统[[经典势]]的模拟。分析高度异质体系或[[非晶材料]]通常需要大规模和长时间的模拟,因此需要开发能够实现稳定[[MD模拟]]的鲁棒性[[MLIP]]。在本研究中,我们利用自研的[[神经网络势]]([[NNP]])生成器,构建了一个[[NNP模型]],该模型能够在广泛[[水合水平]]范围内对[[全氟磺酸离聚物膜]]([[Nafion]])进行大规模、长时间的[[MD模拟]]。通过[[主动学习]]循环迭代扩展数据集,我们成功建立了鲁棒的[[深度势]]([[DP]])模型。具体而言,通过将[[非平衡]][[DPMD模拟]]采样的[[非平衡结构]]与结合[[最小原子间距]]的[[三维结构特征空间]]中的[[结构筛选]]相结合,可显著提升[[DP模型]]的鲁棒性,从而实现对约10,000至20,000个原子的大型[[Nafion体系]]进行长达31 ns的稳定[[MD模拟]]。采用所开发[[DP模型]]的[[MD模拟]]获得的[[氢原子]][[自扩散系数]],在广泛[[水合水平]]范围内比先前小体系[[从头算MD模拟]]结果更接近[[实验值]]。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':属性图上的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':摘要:给定[[图]]$G$和[[种子节点]]$v_s$,[[局部图聚类]](LGC)的目标是在与$C_s$大小近似线性时间内识别出围绕$v_s$的[[子图]]$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图]]的[[应用场景]]。然而现有方案大多仅依赖图中节点的[[拓扑连接性]],容易受到现实[[图谱]]中普遍存在的[[缺失边]]或[[噪声边]]的影响。为此,本文利用[[图拓扑]]与[[节点属性]]的互补特性来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将LGC建模为[[双向扩散分布]](BDD)估计问题,该模型专门用于捕捉带属性节点的[[多跳关联性]]。进一步提出[[LACA]]方法,其核心组件包括:(i) 基于理论基础的快速[[节点属性预处理]]技术;(ii) 具有严格理论保证和加速收敛特性的[[自适应向量扩散算法]];(iii) 高效的BDD近似三步骤方案。在8个[[真实数据集]]上与17种方法的对比实验表明,LACA在真实[[局部簇]]的[[评估指标]]上全面超越现有方法,同时速度提升达数量级。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重构动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成了任何[[社会]]的[[结构性支柱]]。它们通过协调[[地球]]上几乎每一个[[个体]],形成了为所有人生产一切的[[社会新陈代谢系统]]。SCN绝非[[静态存在]],而是通过[[企业]]的进出和[[供应关系]]的[[重组]]持续[[演变]]。本研究利用独特[[数据集]]追踪了一个[[国家]]SCN中企业及其[[供应商]]-[[客户关系]]的[[时间演化]]。基于[[匈牙利]]2014至2022年每月[[增值税]]数据,我们重建了包含711,248家企业和38,644,400条连接的完整[[经济网络]],以[[企业级分辨率]]捕捉了整个[[经济体]]的每次[[重构事件]]。研究发现:每年约25%企业退出SCN,同时28%新企业加入;平均55%的年度供应关系会在次年消失;供应关系的[[半衰期]]为13个月。新连接以[[超偏好依附]]概率$p(i)\propto k_i^{1.08}$($k_i$为企业i的连接数)形成。我们校准的简单[[统计网络]]生成[[模型]]成功复现了匈牙利主导SCN的[[特征模式]],不仅能重现[[入/出度分布]]、[[同配性]]和[[聚类结构]]等[[局部特征]],还能捕捉真实的[[系统性风险]]轮廓。该模型揭示了[[经济网络]]重连[[动态]]对量化[[系统韧性]]和估计[[冲击传导]]的关键作用。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数极大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':我们研究一维[[高斯分布|高斯]][[位置混合模型]]的[[非参数统计|非参数]][[极大似然估计]]量$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定n个[[数据点]]时该估计量总是返回最多含n个分量的[[混合模型]],而近期(Wu-Polyanskiy, 2020)对[[亚高斯分布|亚高斯]][[数据]]给出了严格的$O(\log n)$界。本文研究$\widehat{\pi}$的[[计算复杂性|计算特性]]:提出一种[[算法]],当$\varepsilon>0$足够小时,可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算得到$\widehat\pi$的[[Wasserstein距离]]$\varepsilon$-[[近似解]]。其中$K$与数据相关但与$\varepsilon$无关,$C$为[[绝对常数]],$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的[[原子数]]。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$来自具有[[概率密度函数|密度]](相对于[[Lebesgue测度]])的[[概率分布]]时,这些保证几乎必然成立。我们还证明:当$k\leq \sqrt{n}/3$时,限定为k原子的$\widehat\pi$[[条件分布]]在相应$2k-1$维[[参数空间]]上存在密度,且[[EM算法]]几乎必然具有[[收敛速度|局部线性收敛性]]。关键工具之一是对[[非退化曲线]]的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:一个开放、快速、可靠且高效的每日任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过在多位置复制地址来实现降低[[延迟]]和增强[[韧性]]等目标。由于[[任播]]在现代[[互联网]]中的关键作用,先前研究已开发了执行任播普查的工具。首个工具[[iGreedy]]利用地理分散位置的延迟测量来映射任播部署;第二个工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查,但存在[[准确性]]和[[精确度]]问题。相反,iGreedy精度极高但速度较慢,且[[探测]]成本更高。 本文针对这两个系统的缺陷,提出了[[MAnycast Reloaded]](MAnycastR)。以MAnycast2为基础,我们彻底重新设计了其[[测量管道]],新增[[分布式探测]]支持、额外[[协议]]([[UDP]]、[[TCP]]和[[IPv6]])支持,以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播[[测试平台]]上验证MAnycastR,与外部任播[[生产部署]]进行对比,通过[[RIPE Atlas]]进行广泛延迟测量,并对检测到的60%以上任播[[前缀]]与[[运营商]]真实数据进行[[交叉验证]]。结果表明MAnycastR实现了高准确性和精确度。我们将持续提供每日MAnycastR普查数据,并以宽松[[开源协议]]发布工具[[源代码]]。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习原子间势]]([[MLIPs]])作为一种能够实现大规模、长时间[[原子模拟]]并保持与基于[[密度泛函理论]]([[DFT]])和[[从头算波函数理论]]的[[电子结构计算]]相当精度的方法,引起了广泛关注。然而,基于MLIP的[[分子动力学]]([[MD]])模拟面临的挑战是其稳定性低于使用传统[[经典势]]的模拟。分析高度[[异质体系]]或[[非晶材料]]通常需要大规模和长时间的模拟,因此需要开发能够实现稳定MD模拟的[[鲁棒性|鲁棒MLIP]]。在本研究中,我们利用[[神经网络势]]([[NNP]])生成器,构建了一个NNP模型,能够在广泛[[水合]]水平下对[[全氟离子交换膜]]([[Nafion]])进行大规模、长时间的MD模拟。通过[[主动学习]]循环迭代扩展[[数据集]],我们成功建立了[[深度势]]([[DP]])模型。具体而言,通过将[[非平衡]]DPMD模拟采样的非平衡结构与结合[[最小原子间距]]的[[三维结构特征空间]]中的[[结构筛选]]相结合,可以显著增强DP模型的鲁棒性,从而实现对约10,000至20,000个原子的大型Nafion体系进行长达31 ns的稳定MD模拟。采用所开发DP模型的MD模拟获得的[[氢原子]][[自扩散系数]],在广泛水合水平范围内与[[实验值]]的吻合度优于先前对小体系进行的[[从头算MD模拟]]结果。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':基于属性图的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':给定图$G$和种子节点$v_s$,[[局部图聚类]](LGC)的目标是在与$C_s$大小大致成线性关系的时间内,识别出围绕$v_s$的子图$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图]]的应用场景。然而现有方案大多仅依赖图中节点的[[拓扑连接性]],容易受到现实图谱中普遍存在的缺失或[[噪声链接]]的影响。 为解决该问题,本文利用[[图拓扑]]与[[节点属性]]的互补特性来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将LGC建模为[[双向扩散分布]](BDD)的估计问题——该模型专为捕捉带属性节点的[[多跳亲和力]]而设计。进一步提出[[LACA]]方法,其核心组件包括:(i)基于理论基础的快速[[节点属性预处理]]技术;(ii)具备严格理论保证且加速收敛的[[自适应向量扩散算法]];(iii)高效的[[三步式BDD近似]]方案。在8个[[真实数据集]]上与17种方法的对比实验表明,LACA在[[真实局部簇]]的评估指标上全面优于所有对比方法,同时速度提升达数量级。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重构动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成任何[[社会]]的[[结构性支柱]]。它们通过协调[[地球]]上几乎每一个[[个体]],形成了为所有人生产一切的[[社会代谢系统]]。SCN绝非[[静态存在]],而是通过[[企业]]的进出与[[供应关系]]的[[重组]]持续演变。本研究利用独特[[数据集]]追踪了一个[[国家]]SCN中企业及其[[供应商]]-[[客户关系]]的[[时间演化]]。基于[[匈牙利]]2014至2022年每月[[增值税]]数据,我们重构了包含711,248家企业和38,644,400条连接的完整[[经济网络]],以[[企业级分辨率]]捕捉了整个[[经济体]]的每次[[重构事件]]。研究发现:每年约25%的企业退出SCN,同时28%的[[新企业]]加入;平均55%的现存[[供应链接]]会在次年消失;供应链接的[[半衰期]]为13个月。新链接以超[[偏好依附]]概率$p(i)\propto k_i^{1.08}$($k_i$为企业i的[[供应连接数]])附着于企业。我们校准的简单[[统计网络]]生成模型成功复现了匈牙利主导SCN的典型特征,不仅能再现[[入/出度分布]]、[[同配性]]和[[聚类结构]]等局部[[网络特征]],还能捕捉真实的[[系统性风险]]轮廓。最后探讨了该模型如何通过[[经济重连]]动态来量化[[系统韧性]]及评估[[冲击传导]]。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数最大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':我们研究一维[[高斯分布|高斯]][[位置混合模型]]的[[非参数统计|非参数]][[极大似然估计]]量$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定n个[[数据点]]时该估计量始终返回最多含n个[[混合模型]]的[[分量]],而近期(Wu-Polyanskiy, 2020)对[[亚高斯分布|亚高斯]][[数据]]给出了精确的$O(\log n)$界。本文重点研究$\widehat{\pi}$的[[计算复杂性|计算特性]]:提出一种[[算法]],当$\varepsilon>0$足够小时,可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算出[[Wasserstein距离]]意义下的$\varepsilon$[[近似解]],其中$K$与[[数据]]相关但与$\varepsilon$无关,$C$为[[绝对常数]],$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的[[原子]]数量。我们还能在有限时间内可验证地计算出$|supp(\widehat\pi)|$的精确值。当[[数据集]]$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有[[密度函数]](相对于[[Lebesgue测度]])的[[概率分布]]独立[[采样]]生成时,这些保证几乎必然成立。我们还证明:当$k\leq \sqrt{n}/3$时,限定为k原子结构的$\widehat\pi$[[条件分布]]在相应$2k-1$维[[参数空间]]上存在[[密度函数]],且[[EM算法]]几乎必然具有[[局部收敛性|局部线性收敛性]]。关键工具之一是关于[[非退化曲线]]的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:一个开放、快速、可靠且高效的每日任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过将地址复制到多个位置来实现(例如)降低[[延迟]]和增强[[韧性]]。由于任播在现代[[互联网]]中的关键作用,先前研究引入了执行任播普查的工具。首个工具[[iGreedy]]利用地理分散位置的延迟测量来映射任播部署;第二个工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查,但存在[[准确性]]和[[精确性]]问题。相反,iGreedy精度极高但速度较慢,且探测成本更高。 本文针对这两个系统的缺陷提出了[[MAnycast Reloaded]]([[MAnycastR]])。以MAnycast2为基础,我们彻底重构了其测量流水线,新增[[分布式探测]]支持、额外[[协议]]([[UDP]]、[[TCP]]和[[IPv6]])支持,以及类似iGreedy的延迟测量功能。我们在包含32个全球分布式节点的任播测试平台上验证MAnycastR,与外部任播生产部署进行对比,并通过[[RIPE Atlas]]进行广泛延迟测量,同时针对60%以上检测到的任播前缀与[[运营商]]真实数据进行交叉验证。结果表明MAnycastR实现了高准确性和精确性。我们将持续提供每日MAnycastR普查数据,并以宽松的[[开源许可协议]]发布该工具[[源代码]]。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习原子间势]]([[MLIPs]])作为一种能够实现大规模、长时间[[原子尺度模拟]]的方法,同时保持与基于[[密度泛函理论]]([[DFT]])和[[从头算波函数理论]]的[[电子结构计算]]相当的精度,引起了广泛关注。然而,基于[[MLIP]]的[[分子动力学]]([[MD]])模拟面临的一个挑战是,与传统[[经典势]]相比其[[稳定性]]较低。分析高度[[异质体系]]或[[非晶材料]]通常需要大规模和长时间的模拟,因此需要开发能够实现稳定[[MD模拟]]的鲁棒[[MLIP]]。在本研究中,我们利用自研的[[神经网络势]]([[NNP]])生成器,构建了一个[[NNP模型]],能够在广泛[[水合水平]]下对[[全氟磺酸离子膜]]([[Nafion]])进行大规模、长时间的[[MD模拟]]。通过[[主动学习]]循环迭代扩展[[数据集]],我们成功建立了鲁棒的[[深度势]]([[DP]])模型。具体而言,通过将[[非平衡]][[DPMD模拟]]采样的[[非平衡结构]]与结合[[最小原子间距]]的[[三维结构特征空间]]中的[[结构筛选]]相结合,可显著提升[[DP模型]]的[[鲁棒性]],从而实现对约10,000至20,000个[[原子]]的大型[[Nafion体系]]进行长达31 [[ns]]的稳定[[MD模拟]]。采用所开发[[DP模型]]的[[MD模拟]]获得的[[氢原子]][[自扩散系数]],在广泛[[水合水平]]范围内与[[实验值]]的吻合度较先前小体系[[从头算MD模拟]]有显著提升。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':属性图上的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':摘要:给定[[图]]$G$和[[种子节点]]$v_s$,[[局部图聚类]](LGC)的目标是在与$C_s$大小大致成线性关系的时间内,识别出围绕$v_s$的[[子图]]$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图]]的[[应用场景]]。然而,现有解决方案大多仅依赖图中节点的[[拓扑连接性]],容易受到现实图数据中普遍存在的[[缺失]]或[[噪声链接]]的影响。为解决该问题,本文利用[[图拓扑]]与[[节点属性]]的互补特性来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将LGC建模为[[双向扩散分布]](BDD)的估计问题,该模型专门用于捕捉含属性节点的[[多跳关联性]]。进一步提出[[LACA]]方法——一种高效且具备严格[[理论保证]]的[[LGC]]方案,其核心包括:(i) 基于[[理论基础]]的快速[[节点属性预处理]]技术;(ii) 具有[[自适应扩散]]能力和[[加速收敛]]特性的[[向量传播算法]];(iii) 高效的[[三步式BDD近似]]策略。在8个[[真实数据集]]上与17种[[对比方法]]的实验表明,LACA在[[真实局部簇]]的[[评估指标]]上全面优于所有[[基线方法]],同时实现数量级的[[速度提升]]。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重构动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成了任何社会的结构性支柱。它们通过协调地球上几乎每一个个体,形成了为所有人生产一切的社会[[新陈代谢系统]]。SCN绝非静态存在,而是通过[[企业]]的进出和[[供应关系]]的[[重组]]持续演变。本研究利用独特[[数据集]]追踪了一个国家SCN中企业及其[[供应商]]-[[客户关系]]的[[时间演化]]。基于[[匈牙利]]2014至2022年每月报告的[[增值税]]数据,我们重建了包含711,248家企业和38,644,400条连接的完整[[经济网络]],以企业级分辨率捕捉了整个[[经济体]]的每次[[重构事件]]。研究发现:每年约25%的企业退出SCN,同时28%的新企业加入;平均55%的年度供应关系会在次年消失;供应关系的[[半衰期]]为13个月。新连接以超[[偏好依附]]概率$p(i)\propto k_i^{1.08}$($k_i$表示企业i的供应连接数)附着于企业。我们校准了一个能复现匈牙利主导SCN典型特征的简易[[统计网络]]生成模型,该模型不仅再现了[[入度]]/[[出度]]分布、[[同配性]]和[[聚类结构]]等局部[[网络特征]],还捕捉了真实的[[系统性风险]]特征。最后探讨了[[经济重连]]动态对量化[[系统韧性]]和估计[[冲击传导]]的关键作用。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数极大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':我们研究一维[[高斯分布|高斯]][[位置混合模型]]的[[非参数统计|非参数]][[最大似然估计]]量$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定n个[[数据点]]时,该估计量始终返回最多含n个分量的[[混合模型]],而近期(Wu-Polyanskiy, 2020)对[[亚高斯分布|亚高斯]][[数据]]给出了精确的$O(\log n)$界。本文重点研究$\widehat{\pi}$的[[计算复杂性|计算特性]]:我们提出一种[[算法]],当$\varepsilon>0$足够小时,可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算得到$\widehat\pi$的[[Wasserstein距离]]$\varepsilon$-近似解,其中$K$与数据相关但与$\varepsilon$无关,$C$为绝对常数,$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的[[原子]]数量。我们还可在有限时间内确定性计算$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有[[概率密度函数|密度]](相对于[[Lebesgue测度]])的[[概率分布]]独立采样生成时,这些保证几乎必然成立。我们进一步证明:当$\widehat\pi$被约束为k原子分布时,对所有$k\leq \sqrt{n}/3$,其在相应$2k-1$维[[参数空间]]上存在密度,且[[EM算法]]几乎必然具有[[收敛速度|局部线性收敛性]]。关键工具之一是对[[非退化曲线]]的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:一个开放、快速、可靠且高效的每日任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过将地址复制到多个位置来实现(例如)降低[[延迟]]和增强[[韧性]]。由于任播在现代[[互联网]]中的关键作用,先前研究已开发了执行任播普查的工具。首个工具[[iGreedy]]利用地理分散位置的延迟测量来映射任播部署;第二个工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查,但存在[[准确性]]和[[精确性]]问题。相反,iGreedy精度极高但速度较慢,且[[探测]]成本更高。 本文针对这两个系统的缺陷提出了[[MAnycast Reloaded]](MAnycastR)。基于MAnycast2,我们彻底重构了其[[测量流水线]],新增[[分布式探测]]支持、额外[[协议]]([[UDP]]、[[TCP]]和[[IPv6]])支持以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播[[测试平台]]上验证MAnycastR,与外部任播[[生产部署]]对比,并通过[[RIPE Atlas]]进行大规模延迟测量,同时将检测到的60%以上任播[[前缀]]与[[运营商]]真实数据交叉核验。结果表明MAnycastR实现了高准确性与精确度。我们以宽松[[开源协议]]向[[社区]]提供每日持续的MAnycastR普查数据,并公开该工具的[[源代码]]。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子间势的聚合物电解质膜质子传输大规模长时原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习原子间势]]([[MLIPs]])作为一种能够实现大规模、长时间[[原子模拟]]并保持与基于[[密度泛函理论]]([[DFT]])和[[从头算波函数理论]]的[[电子结构计算]]相当精度的方法,引起了广泛关注。然而,基于[[MLIP]]的[[分子动力学]]([[MD]])模拟面临的关键挑战是其稳定性低于传统[[经典势函数]]。分析高度异质体系或[[非晶材料]]通常需要大规模长时间模拟,这要求开发能够实现稳定[[MD模拟]]的鲁棒性[[MLIP]]。本研究利用自研[[神经网络势]]([[NNP]])生成器,构建了可在广泛[[水合度]]范围内对[[全氟离聚物膜]]([[Nafion]])进行大规模长时间[[MD模拟]]的[[NNP模型]]。通过[[主动学习]]循环迭代扩展[[数据集]],我们成功建立了鲁棒的[[深度势]]([[DP]])模型。具体而言,通过将[[非平衡态]][[DPMD模拟]]采样的[[非平衡结构]]与融合[[最小原子间距]]的[[三维结构特征空间]]筛选相结合,可显著提升[[DP模型]]的鲁棒性,从而实现对约10,000至20,000[[原子]]的大型[[Nafion体系]]持续31[[纳秒]]的稳定[[MD模拟]]。采用所开发[[DP模型]]的[[MD模拟]]获得的[[氢原子]][[自扩散系数]],在宽[[水合度]]范围内比先前小体系[[从头算MD模拟]]结果更接近[[实验值]]。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':基于属性图的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':给定图$G$和种子节点$v_s$,[[局部图聚类]](LGC)的目标是在与$C_s$大小近似线性时间内识别围绕$v_s$的子图$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图]]的[[应用场景]]。然而现有方案大多仅依赖图中节点的[[拓扑连接性]],容易受到现实图数据中普遍存在的[[缺失]]或[[噪声链接]]的影响。为解决该问题,本文利用[[图拓扑]]与[[节点属性]]的互补特性来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将LGC建模为[[双向扩散分布]](BDD)的估计问题——该分布专门用于捕捉带属性节点的[[多跳关联性]]。进一步提出[[LACA]]方法,其核心组件包括:(i)基于理论基础的快速[[节点属性预处理]]技术;(ii)具备理论保证和加速收敛特性的[[自适应向量扩散算法]];(iii)高效的BDD近似三步骤方案。在8个[[真实数据集]]上与17种方法的对比实验表明,LACA在真实[[局部簇]]的[[评估指标]]上全面优于所有对比方法,同时实现数量级的[[速度提升]]。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重构动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成任何[[社会]]的[[结构性支柱]]。它们通过协调[[地球]]上几乎每一个[[个体]],形成了为所有人生产一切的[[社会新陈代谢系统]]。SCN绝非[[静态存在]],而是通过[[企业]]的进出与[[供应关系]]的[[重组]]持续[[演变]]。本研究利用独特[[数据集]]追踪了一个[[国家]]SCN中企业及其[[供需关系]]的[[时序演化]]。基于[[匈牙利]]2014至2022年每月报告的[[增值税]]数据,我们重构了包含711,248家企业和38,644,400条连接的完整[[经济网络]],以[[企业级分辨率]]捕捉了整个[[经济体]]的每次[[重构事件]]。研究发现:每年约25%的企业退出SCN,同时28%的[[新企业]]加入;平均55%的现存[[供应链接]]会在次年消失;供应链接的[[半衰期]]为13个月。新链接以[[超偏好依附]]概率$p(i)\propto k_i^{1.08}$($k_i$表示企业i的[[供应连接数]])附着于企业。我们校准了一个能复现匈牙利主导SCN典型特征的简易[[统计网络生成模型]],该模型不仅重现了[[入/出度分布]]、[[同配性]]和[[聚类结构]]等[[局部网络特征]],还捕捉了真实的[[系统性风险]]轮廓。最后探讨了[[经济重连动态]]对量化[[系统韧性]]和估计[[冲击传导]]的关键作用。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数最大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':我们研究一维[[高斯分布|高斯]][[位置混合模型]]的[[非参数统计|非参数]][[极大似然估计]]量$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定n个[[数据点]]时,该估计量总是返回最多含n个分量的[[混合模型]],而近期(Wu-Polyanskiy, 2020)对[[次高斯分布|次高斯]][[数据]]给出了精确的$O(\log n)$界。本文重点研究$\widehat{\pi}$的[[计算复杂性|计算特性]]:我们提出一种[[算法]],当$\varepsilon>0$足够小时,可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算出[[Wasserstein距离]]意义上的$\varepsilon$[[近似解]],其中$K$与数据相关但与$\varepsilon$无关,$C$为[[绝对常数]],$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的[[原子数量]]。我们还可在有限时间内确定性计算出$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$来自具有[[概率密度函数|密度]](相对于[[Lebesgue测度]])的[[概率分布]]时,这些保证几乎必然成立。我们进一步证明:当$k\leq \sqrt{n}/3$时,限定为k原子性的$\widehat\pi$[[条件分布]]在相关$2k-1$维[[参数空间]]上存在密度,且[[EM算法]]几乎必然具有[[局部收敛性|局部线性收敛性]]。关键工具之一是针对[[非退化曲线]]的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:开放、快速、可靠且高效的日常任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过在多位置复制地址来实现降低[[延迟]]和增强[[韧性]]等目标。由于[[任播]]在现代[[互联网]]中的关键作用,先前研究已开发了执行任播普查的工具。首个工具[[iGreedy]]利用地理分散节点的延迟测量来绘制任播部署图;第二个工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查,但存在[[准确性]]和[[精确度]]问题。相反,iGreedy精度极高但速度较慢,且探测成本更高。 本文针对这两个系统的缺陷,提出了[[MAnycast Reloaded]](MAnycastR)。以MAnycast2为基础,我们彻底重构了其测量管道,新增[[分布式探测]]支持、额外[[协议]]([[UDP]]、[[TCP]]和[[IPv6]])支持以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR,对比外部任播生产部署,通过[[RIPE Atlas]]进行广泛延迟测量,并将检测到的60%以上任播前缀与[[运营商]]真实数据交叉核验。结果表明MAnycastR实现了高准确性与精确度。我们以宽松[[开源协议]]发布工具源码,并向[[社区]]提供持续的每日MAnycastR普查数据。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习原子间势]]([[MLIPs]])作为一种能够实现大规模、长时间[[原子模拟]]并保持与基于[[密度泛函理论]]([[DFT]])和[[从头算波函数理论]]的[[电子结构计算]]相当精度的方法,受到了广泛关注。然而,基于[[MLIP]]的[[分子动力学]]([[MD]])模拟面临的关键挑战是其稳定性低于传统[[经典势函数]]。分析高度异质体系或[[非晶材料]]通常需要大规模长时间模拟,因此亟需开发能够支持稳定[[MD模拟]]的鲁棒性[[MLIP]]。本研究利用自主开发的[[神经网络势]]([[NNP]])生成器,构建了可在广泛水合水平范围内对[[全氟离聚物膜]]([[Nafion]])进行大规模长时间[[MD模拟]]的[[NNP模型]]。通过[[主动学习]]循环迭代扩展数据集,我们成功建立了鲁棒的[[深度势]]([[DP]])模型。具体而言,通过将[[非平衡态]][[DPMD模拟]]采样的[[非平衡结构]]与融合最小原子间距的[[三维结构特征空间]]筛选相结合,显著提升了[[DP模型]]的鲁棒性,使得对约10,000至20,000个原子的大规模[[Nafion体系]]进行长达31纳秒的稳定[[MD模拟]]成为可能。采用所开发[[DP模型]]的[[MD模拟]]获得的[[氢原子]][[自扩散系数]],在广泛水合水平范围内比先前小体系[[从头算MD模拟]]结果更接近[[实验值]]。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':属性图上的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':摘要:给定[[图]]$G$和[[种子节点]]$v_s$,[[局部图聚类]](LGC)的目标是在与$C_s$大小大致成线性关系的时间内,识别出围绕$v_s$的[[子图]]$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其非常适用于涉及[[大规模图]]的众多[[应用场景]]。然而,现有解决方案大多仅依赖图中节点的[[拓扑连接性]],容易受到现实图数据中普遍存在的[[缺失链接]]或[[噪声链接]]的影响。为解决这一问题,本文利用[[图拓扑]]与[[节点属性]]的互补特性来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将LGC建模为[[双向扩散分布]](BDD)的估计问题,该模型专门用于捕捉含属性节点的[[多跳关联性]]。进一步提出[[LACA]]方法——一种高效且具备严格[[理论保证]]的LGC解决方案,其核心组件包括:(i) 基于理论基础的快速[[节点属性预处理]]技术,(ii) 具有[[自适应扩散]]能力和[[加速收敛]]特性的[[向量传播算法]], (iii) 高效的[[三步式BDD近似]]方案。通过在8个[[真实数据集]]上与17种[[对比方法]]的实验表明,LACA在[[真实局部簇]]的[[评估指标]]上全面优于所有对比方法,同时[[速度提升]]达[[数量级]]。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重构动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成任何[[社会]]的[[结构性支柱]]。它们通过协调[[地球]]上几乎每一个[[个体]],形成了为所有人生产一切的[[社会新陈代谢系统]]。SCN绝非[[静态存在]],而是通过[[企业]]的进出和[[供应关系]]的[[重组]]持续[[演变]]。本文利用独特[[数据集]]研究了一个[[国家]]SCN中企业及其[[供应商]]-[[买方]]关系的[[时间演化]]。基于[[匈牙利]]2014至2022年按月申报的[[增值税]]数据,我们重建了包含711,248家企业和38,644,400条连接的[[整体经济网络]],以[[企业级分辨率]]覆盖了几乎整个[[经济体]]的所有[[重构事件]]。研究发现:每年约25%的企业退出SCN,同时28%的新企业加入;平均55%的现存[[供应链接]]会在次年消失;供应链接的[[半衰期]]为13个月。新链接以超偏好概率$p(i)\propto k_i^{1.08}$依附企业($k_i$表示企业i的[[供应连接数]])。我们校准了一个能复现匈牙利主导SCN典型特征的简易[[统计网络生成模型]],该模型不仅重现了[[入/出度分布]]、[[同配性]]和[[聚类结构]]等[[局部网络特征]],还捕捉了真实的[[系统性风险]]轮廓。最后讨论了[[经济重连动态]]对量化[[系统韧性]]和估计[[冲击传导]]的关键作用。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数最大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':我们研究一维[[高斯分布|高斯]][[位置混合模型]]的[[非参数统计|非参数]][[极大似然估计]]量$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定n个[[数据点]]时该估计量总是返回最多含n个[[混合模型|分量]]的混合模型,而近期(Wu-Polyanskiy, 2020)对[[亚高斯分布|亚高斯]][[数据]]给出了精确的$O(\log n)$界。本文研究$\widehat{\pi}$的[[计算复杂性|计算特性]]:我们提出一种[[算法]],当$\varepsilon>0$足够小时,可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算出[[Wasserstein距离]]意义上的$\varepsilon$[[近似解]],其中$K$与数据相关但与$\varepsilon$无关,$C$为[[绝对常数]],$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的[[原子数量]]。我们还可在有限时间内确定性计算出$|supp(\widehat\pi)|$的精确值。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有[[密度函数]](相对于[[Lebesgue测度]])的[[概率分布]]独立采样生成时,这些保证几乎必然成立。我们还证明:当$k\leq \sqrt{n}/3$时,限定为k原子的$\widehat\pi$[[条件分布]]在对应的$2k-1$维[[参数空间]]上存在密度函数,且[[EM算法]]几乎必然具有[[局部收敛性|局部线性收敛性]]。关键工具之一是针对[[非退化曲线]]的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:一个开放、快速、可靠且高效的每日任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过将地址复制到多个位置来实现(例如)降低[[延迟]]和增强[[韧性]]。由于[[任播]]在现代[[互联网]]中的关键作用,先前研究已引入执行[[任播普查]]的工具。首个工具[[iGreedy]]利用地理分散位置的延迟测量来映射任播部署;第二个工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。[[MAnycast2]]的优势在于速度——可在3小时内完成全网普查,但存在[[准确性]]和[[精确性]]问题。相反,[[iGreedy]]精度极高但速度较慢,且[[探测成本]]更高。 本文针对这两个系统的缺陷,提出了[[MAnycast Reloaded]]([[MAnycastR]])。以[[MAnycast2]]为基础,我们彻底重新设计了其[[测量流水线]],新增[[分布式探测]]支持、额外[[协议]]([[UDP]]、[[TCP]]和[[IPv6]])支持,以及类似[[iGreedy]]的延迟测量功能。我们在含32个全球分布式节点的[[任播测试平台]]上验证[[MAnycastR]],与外部任播生产部署对比,并通过[[RIPE Atlas]]进行广泛延迟测量,同时将检测到的60%以上[[任播前缀]]与[[运营商]]真实数据交叉核验。结果表明[[MAnycastR]]实现了高[[准确性]]与[[精确度]]。我们以宽松[[开源协议]]向[[社区]]提供每日持续的[[MAnycastR]]普查数据,并公开该工具的[[源代码]]。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习原子间势]]([[MLIPs]])作为一种能够实现大规模、长时间[[原子尺度模拟]]的方法,同时保持与基于[[密度泛函理论]]([[DFT]])和[[第一性原理]][[波函数理论]]的[[电子结构计算]]相当的精度,引起了广泛关注。然而,基于[[MLIP]]的[[分子动力学]]([[MD]])模拟面临的一个挑战是,与传统[[经典势]]相比其稳定性较低。分析高度异质体系或[[非晶材料]]通常需要大规模和长时间的模拟,因此需要开发能够实现稳定[[MD模拟]]的鲁棒性[[MLIPs]]。在本研究中,我们利用自研的[[神经网络势]]([[NNP]])生成器,构建了一个[[NNP模型]],该模型能够对不同水合水平的[[全氟离聚物膜]]([[Nafion]])进行大规模、长时间的[[MD模拟]]。通过[[主动学习]][[循环迭代]]扩展数据集,我们成功建立了鲁棒的[[深度势]]([[DP]])模型。具体而言,通过将非平衡[[DPMD]]模拟采样的非平衡结构与结合最小[[原子间距]]的三维[[结构特征空间]]中的结构筛选相结合,可以显著增强[[DP模型]]的鲁棒性,从而实现对约10,000至20,000个原子的大型[[Nafion体系]]进行长达31 ns的稳定[[MD模拟]]。采用所开发[[DP模型]]进行的[[MD模拟]]获得的[[氢原子]][[自扩散系数]],与先前较小体系的[[第一性原理]][[MD模拟]]相比,在更广泛的[[水合水平]]范围内与[[实验值]]更为吻合。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':属性图上的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':给定[[图]]$G$和[[种子节点]]$v_s$,[[局部图聚类]](LGC)的目标是在与$C_s$大小大致成线性关系的时间内,识别出围绕$v_s$的[[子图]]$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图]]的[[应用场景]]。然而,现有解决方案大多仅依赖图中节点的[[拓扑连接]]关系,容易受到现实图数据中普遍存在的[[缺失链接]]或[[噪声链接]]的影响。 为解决这一问题,本文利用[[图拓扑]]与[[节点属性]]的[[互补特性]]来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将LGC问题建模为[[双向扩散分布]](BDD)的估计问题,该模型专门用于捕捉含属性图中节点的[[多跳关联性]]。进一步提出[[LACA]]方法——一种高效且具备严格[[理论保证]]的LGC解决方案:其核心组件包括(i)快速且理论完备的[[节点属性预处理]]技术,(ii)具有[[理论收敛]]保证的[[自适应向量扩散]]算法,(iii)高效的[[三步式BDD近似]]方案。通过在8个[[真实数据集]]上与17种[[对比方法]]的实验表明,LACA在[[真实局部簇]]的衡量标准下均优于所有对比方法,同时[[速度提升]]达[[数量级]]。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重构动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成了任何社会的结构性支柱。它们通过协调地球上几乎每一个个体,形成了为所有人生产一切的社会[[新陈代谢]]系统。SCN绝非静态存在,而是通过[[企业]]的进出和[[供应关系]]的[[重组]]持续演变。本文利用独特[[数据集]]研究了一个国家SCN中企业及其[[供应商]]-[[客户关系]]的[[时间演化]]。基于[[匈牙利]]2014至2022年每月报告的[[增值税]]数据,我们重建了包含711,248家企业和38,644,400条连接的[[整体经济网络]],以企业级[[分辨率]]覆盖了几乎所有的[[经济重构]]事件。研究发现:每年约25%的企业退出SCN,同时28%的新企业加入;平均55%的年度供应关系会在次年消失;供应关系的[[半衰期]]为13个月。新连接以超偏好概率$p(i)\propto k_i^{1.08}$依附企业($k_i$表示企业i的供应连接数)。我们校准了一个能复现匈牙利主导SCN典型特征的简单[[统计网络]]生成模型,该模型不仅再现了[[入度]]/[[出度分布]]、[[同配性]]和[[聚类结构]]等局部[[网络特征]],还捕捉了真实的[[系统性风险]]轮廓。最后讨论了[[经济重连]]动态对量化[[系统韧性]]和估计[[冲击传导]]的关键作用。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数最大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':我们研究一维[[高斯分布|高斯]][[位置混合模型]]的[[非参数统计|非参数]][[最大似然估计]]量$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定n个[[数据点]]时,该估计量始终返回最多含n个分量的混合模型,而近期(Wu-Polyanskiy, 2020)对[[亚高斯分布|亚高斯]][[数据]]给出了严格的$O(\log n)$界。本研究聚焦$\widehat{\pi}$的[[计算复杂性|计算特性]]:我们提出一种[[算法]],当$\varepsilon>0$足够小时,可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算得到$\widehat\pi$的[[Wasserstein距离]]$\varepsilon$-近似解。其中$K$与数据相关但独立于$\varepsilon$,$C$为[[绝对常数]],$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的[[原子数量]]。我们还实现了[[支撑集]]大小$|supp(\widehat\pi)|$的[[有限时间]]可验证计算。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有[[概率密度函数|密度]](相对于[[Lebesgue测度]])的[[概率分布]]独立采样生成时,这些保证几乎必然成立。我们进一步证明:对于所有$k\leq \sqrt{n}/3$,限定为k原子结构的$\widehat\pi$条件分布在相应$2k-1$维[[参数空间]]上具有密度,且[[EM算法]]几乎必然具有[[局部收敛性|局部线性收敛性]]。关键工具之一是对[[非退化曲线]]的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:一个开放、快速、可靠且高效的每日任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过在多位置复制地址来实现降低[[延迟]]和增强[[韧性]]等目标。由于任播在现代[[互联网]]中的关键作用,先前研究已开发了执行任播普查的工具。首个工具[[iGreedy]]利用地理分散位置的延迟测量来映射任播部署;第二个工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查,但存在[[准确性]]和[[精确性]]问题。相反,iGreedy精度极高但速度较慢,且探测成本更高。 本文针对这两个系统的缺陷提出了[[MAnycast Reloaded]](MAnycastR)。以MAnycast2为基础,我们彻底重新设计了其测量管道,新增[[分布式探测]]支持、额外[[协议]]([[UDP]]、[[TCP]]和[[IPv6]])支持,以及类似iGreedy的延迟测量功能。我们在含32个全球分布式节点的任播测试平台上验证MAnycastR,与外部任播生产部署进行对比,并通过[[RIPE Atlas]]进行广泛延迟测量,同时对检测到的60%以上任播前缀进行[[运营商]]真实数据交叉验证。结果表明MAnycastR实现了高准确性与精确度。我们将持续提供每日MAnycastR普查数据,并以宽松[[开源协议]]发布工具[[源代码]]。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子势的聚合物电解质膜质子传输大规模长时原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习原子间势]]([[MLIPs]])作为一种能够实现大规模、长时间[[原子模拟]]并保持与基于[[密度泛函理论]]([[DFT]])和[[从头算波函数理论]]的[[电子结构计算]]相当精度的方法,引起了广泛关注。然而,基于[[MLIP]]的[[分子动力学]]([[MD]])模拟面临的挑战是其稳定性低于使用传统[[经典势]]的模拟。分析高度异质体系或[[非晶材料]]通常需要大规模和长时间的模拟,因此需要开发能够实现稳定[[MD模拟]]的鲁棒[[MLIP]]。在本研究中,我们利用自研的[[神经网络势]]([[NNP]])生成器,构建了一个[[NNP模型]],该模型能够对[[全氟磺酸离聚物膜]]([[Nafion]])在不同水合水平下进行大规模、长时间的[[MD模拟]]。通过[[主动学习]]循环迭代扩展数据集,我们成功建立了鲁棒的[[深度势]]([[DP]])模型。具体而言,通过将非平衡[[DPMD]]模拟采样的非平衡结构与结合最小原子间距的[[三维结构特征空间]]中的结构筛选相结合,可显著提升[[DP模型]]的鲁棒性,从而实现对约10,000至20,000个原子的大型[[Nafion]]体系进行长达31 ns的稳定[[MD模拟]]。采用所开发[[DP模型]]的[[MD模拟]]获得的[[氢原子]]自扩散系数,在广泛水合水平范围内比先前小体系[[从头算MD模拟]]结果更接近[[实验值]]。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':属性图上的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':摘要:给定[[图]]$G$和[[种子节点]]$v_s$,[[局部图聚类]](LGC)的目标是在与$C_s$大小近似线性相关的时间内,识别出围绕$v_s$的[[子图]]$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图]]的[[应用场景]]。然而,现有解决方案大多仅依赖图中节点的[[拓扑连接]]关系,容易受到现实图数据中普遍存在的[[缺失链接]]或[[噪声链接]]的影响。为解决该问题,本文利用[[图拓扑]]与[[节点属性]]的互补特性来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将LGC建模为[[双向扩散分布]](BDD)的估计问题,该模型专门用于捕捉带属性节点的[[多跳关联性]]。进一步提出[[LACA]]方法——一种高效且具备严格[[理论保证]]的LGC解决方案,其核心包括:(i) 快速且理论完备的[[节点属性预处理]]技术,(ii) 具有[[理论收敛]]保证的[[自适应向量扩散]]算法,(iii) 高效的[[三步式BDD近似]]方案。在8个[[真实数据集]]上与17种[[基线方法]]的对比实验表明,LACA在[[真实局部簇]]的[[评估指标]]上全面优于所有对比方法,同时[[速度提升]]达[[数量级]]。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':Supply chain network rewiring dynamics at the firm-level * '''中文标题''':企业层面的供应链网络重构动态 * '''发布日期''':2025-03-26 14:42:44+00:00 * '''作者''':Tobias Reisch, András Borsos, Stefan Thurner * '''分类''':econ.GN, nlin.AO, physics.soc-ph, q-fin.EC *'''原文链接''':http://arxiv.org/abs/2503.20594v1 '''中文摘要''':[[供应链网络]](SCN)构成任何[[社会]]的[[结构性支柱]]。它们通过协调[[地球]]上几乎每一个[[个体]],形成了为所有人生产一切的[[社会新陈代谢系统]]。SCN绝非[[静态存在]],而是通过[[企业]]的进出与[[供应关系]]的[[重组]]持续演变。本研究利用独特[[数据集]]追踪了一个[[国家]]SCN中企业及其供需关系的[[时序演化]]。基于[[匈牙利]]2014至2022年每月报告的[[增值税]]数据,我们重建了包含711,248家企业和38,644,400条连接的完整[[经济网络]],以[[企业级分辨率]]捕捉了整个[[经济体]]的每次[[重构事件]]。研究发现:每年约25%的企业退出SCN,同时28%的新企业加入;平均55%的年度供应关系会在次年消失;供应关系的[[半衰期]]为13个月。新连接以[[超偏好依附]]方式链接企业,概率满足$p(i)\propto k_i^{1.08}$($k_i$表示企业i的[[供应连接数]])。我们校准的简易[[统计网络生成模型]]成功复现了匈牙利主导SCN的[[典型特征]],不仅能重现[[入/出度分布]]、[[同配性]]和[[聚类结构]]等[[局部网络特征]],还可捕捉真实的[[系统性风险]]轮廓。该模型揭示了[[经济网络]]重连动态对量化[[系统韧性]]和估计[[冲击传导]]的关键作用。 == 摘要 == * '''原文标题''':Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior * '''中文标题''':高斯位置混合的非参数最大似然估计:可验证计算与通用行为 * '''发布日期''':2025-03-26 03:36:36+00:00 * '''作者''':Yury Polyanskiy, Mark Sellke * '''分类''':math.ST, stat.ML, stat.TH *'''原文链接''':http://arxiv.org/abs/2503.20193v1 '''中文摘要''':我们研究一维[[高斯分布|高斯]][[位置混合]]的[[非参数统计|非参数]][[极大似然估计|极大似然估计量]]$\widehat{\pi}$。自(Lindsay, 1983)以来已知,给定n个[[数据点]]时该估计量始终返回最多含n个[[混合分布]]的[[分量]],而近期(Wu-Polyanskiy, 2020)对[[亚高斯分布|亚高斯数据]]给出了严格的$O(\log n)$界。本文研究$\widehat{\pi}$的[[计算复杂性|计算特性]]:提出一种[[算法]],当$\varepsilon>0$足够小时,可在$K+Cnk^2\log\log(1/\varepsilon)$时间内计算得到$\widehat\pi$的[[Wasserstein距离]]$\varepsilon$-[[近似解]]。其中$K$与数据相关但独立于$\varepsilon$,$C$为[[绝对常数]],$k=|supp(\widehat{\pi})|\leq n$表示$\widehat\pi$的[[原子数]]。我们还可在有限时间内[[确定性算法|确定性计算]]$|supp(\widehat\pi)|$的[[精确值]]。当数据集$(x_1,\dots,x_n)\in [-cn^{1/4},cn^{1/4}]$由具有[[密度函数]](相对于[[Lebesgue测度]])的[[概率分布]]独立采样时,这些保证几乎必然成立。同时证明:当$k\leq \sqrt{n}/3$时,限定为k原子分布的$\widehat\pi$[[条件分布]]在相应$2k-1$维[[参数空间]]上存在密度函数,且[[EM算法]]几乎必然具有[[局部收敛性|局部线性收敛性]]。关键工具之一是对[[非退化曲线]]的经典[[傅里叶分析]]估计。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:开放、快速、可靠且高效的每日任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过将地址复制到多个位置来实现(例如)降低[[延迟]]和增强[[韧性]]。由于[[任播]]在现代[[互联网]]中的关键作用,先前研究已开发了执行任播普查的工具。首个工具[[iGreedy]]利用地理分散位置的延迟测量来映射任播部署;第二个工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查,但存在[[准确性]]和[[精确度]]问题;而iGreedy虽然高度准确,但速度较慢且探测成本更高。 本文针对这两个系统的缺陷,提出了[[MAnycast Reloaded]]([[MAnycastR]])。我们以MAnycast2为基础,彻底重构其测量流水线,新增[[分布式探测]]支持、额外[[协议]]([[UDP]]、[[TCP]]和[[IPv6]])支持以及类似iGreedy的延迟测量功能。通过在含32个全球分布式节点的任播测试床上验证MAnycastR,对比外部任播生产部署和[[RIPE Atlas]]的大规模延迟测量数据,并对检测到的60%以上任播前缀进行运营商真实数据交叉检验,证明MAnycastR具备高准确性和精确度。我们将持续提供每日MAnycastR普查数据,并以宽松[[开源协议]]发布工具[[源代码]]。 == 摘要 == * '''原文标题''':Large-Scale, Long-Time Atomistic Simulations of Proton Transport in Polymer Electrolyte Membranes Using a Neural Network Interatomic Potential * '''中文标题''':基于神经网络原子间势的聚合物电解质膜质子传输大规模长时原子模拟 * '''发布日期''':2025-03-26 10:40:30+00:00 * '''作者''':Yuta Yoshimoto, Naoki Matsumura, Yuto Iwasaki, Hiroshi Nakao, Yasufumi Sakai * '''分类''':cond-mat.mtrl-sci, physics.comp-ph *'''原文链接''':http://arxiv.org/abs/2503.20412v1 '''中文摘要''':近年来,[[机器学习原子间势]]([[MLIPs]])作为一种能够实现大规模、长时间[[原子模拟]]并保持与基于[[密度泛函理论]]([[DFT]])和[[从头算波函数理论]]的[[电子结构计算]]相当精度的方法,引起了广泛关注。然而,基于[[MLIP]]的[[分子动力学]]([[MD]])模拟面临的挑战是其稳定性低于使用传统[[经典势]]的模拟。分析高度异质体系或[[非晶材料]]通常需要大规模和长时间的模拟,因此需要开发能够实现稳定[[MD模拟]]的鲁棒[[MLIP]]。在本研究中,我们利用自研的[[神经网络势]]([[NNP]])生成器,构建了一个[[NNP模型]],能够在广泛水合水平下对[[全氟磺酸离子膜]]([[Nafion]])进行大规模、长时间的[[MD模拟]]。通过[[主动学习]]循环迭代扩展数据集,我们成功建立了鲁棒的[[深度势]]([[DP]])模型。具体而言,通过将非平衡[[DPMD]]模拟采样的非平衡结构与结合最小原子间距的[[三维结构特征空间]]中的结构筛选相结合,可显著提升[[DP模型]]的鲁棒性,从而实现对约10,000至20,000个原子的大型[[Nafion]]体系进行长达31 ns的稳定[[MD模拟]]。采用所开发[[DP模型]]的[[MD模拟]]获得的[[氢原子]]自扩散系数,在广泛水合水平范围内比先前较小体系的[[从头算MD模拟]]结果更接近[[实验值]]。 == 摘要 == * '''原文标题''':Adaptive Local Clustering over Attributed Graphs * '''中文标题''':基于属性图的自适应局部聚类 * '''发布日期''':2025-03-26 12:24:07+00:00 * '''作者''':Haoran Zheng, Renchi Yang, Jianliang Xu * '''分类''':cs.SI, cs.DS, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.20488v1 '''中文摘要''':给定[[属性图]]$G$和[[种子节点]]$v_s$,[[局部图聚类]](LGC)的目标是在与$C_s$大小近似线性相关的时间内,识别出围绕$v_s$的[[子图]]$C_s$(即[[局部簇]])。这种方法无需访问整个图即可生成[[个性化簇]],使其特别适用于涉及[[大规模图]]的[[应用场景]]。然而现有方案大多仅依赖图中节点的[[拓扑连接性]],容易受到现实图中普遍存在的[[缺失链接]]或[[噪声链接]]的影响。 为解决该问题,本文利用[[图拓扑]]与[[节点属性]]的[[互补特性]]来提升[[局部聚类]]质量。为有效挖掘[[属性信息]],我们首先将LGC建模为[[双向扩散分布]](BDD)的估计问题,该模型专门用于捕捉含属性节点的[[多跳关联性]]。进一步提出[[LACA]]方法——一种高效且具备强[[局部性]]的LGC解决方案,在多个[[真实数据集]]上表现出卓越性能。其核心组件包括:(i)基于[[理论基础]]的快速[[节点属性预处理]]技术;(ii)具有严格[[理论保证]]和[[加速收敛]]特性的[[自适应向量扩散算法]];(iii)高效的BDD近似[[三步骤方案]]。通过在8个[[真实数据集]]上与17种[[对比方法]]的实验表明,LACA在[[真实局部簇标准]]下的结果质量优于所有对比方法,同时速度可提升数个[[数量级]]。代码已开源:https://github.com/HaoranZ99/alac。 == 摘要 == * '''原文标题''':MAnycast Reloaded: a Tool for an Open, Fast, Responsible and Efficient Daily Anycast Census * '''中文标题''':MAnycast重装上阵:一个开放、快速、可靠且高效的日常任播普查工具 * '''发布日期''':2025-03-26 13:49:26+00:00 * '''作者''':Remi Hendriks, Matthew Luckie, Mattijs Jonker, Raffaele Sommese, Roland van Rijswijk-Deij * '''分类''':cs.NI *'''原文链接''':http://arxiv.org/abs/2503.20554v1 '''中文摘要''':[[IP任播]]是一种广泛采用的技术,通过将地址复制到多个位置来实现(例如)降低[[延迟]]和增强[[韧性]]。由于任播在现代[[互联网]]中的关键作用,先前研究已引入工具来执行任播普查。首个工具[[iGreedy]]利用地理分散位置的延迟测量来映射任播部署;第二个工具[[MAnycast2]]则利用任播技术对其他任播网络进行普查。MAnycast2的优势在于速度——可在3小时内完成全网普查,但存在[[准确性]]和[[精确度]]问题。相反,iGreedy精度极高但速度较慢,且探测成本更高。 本文针对这两个系统的缺陷,提出了[[MAnycast Reloaded]](MAnycastR)。我们以MAnycast2为基础,彻底重构其测量流水线,新增[[分布式探测]]支持、额外[[协议]]([[UDP]]、[[TCP]]和[[IPv6]])支持,以及类似iGreedy的延迟测量功能。通过在含32个全球分布式节点的任播测试床上验证,与外部任播生产部署对比,结合[[RIPE Atlas]]的广泛延迟测量,并对检测到的60%以上任播前缀进行[[运营商]]数据交叉核验,证明MAnycastR具备高准确性与精确度。我们将持续提供每日MAnycastR普查数据,并以宽松[[开源协议]]发布工具[[源代码]]。
返回
WikiEdge:ArXiv速递/2025-03-26
。
导航菜单
个人工具
创建账号
登录
命名空间
项目页面
讨论
不转换
不转换
简体
繁體
大陆简体
香港繁體
澳門繁體
大马简体
新加坡简体
臺灣正體
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
工具
链入页面
相关更改
特殊页面
页面信息