WikiEdge:ArXiv速递/2025-03-06
摘要
- 原文标题:Predictable Scale: Part I -- Optimal Hyperparameter Scaling Law in Large Language Model Pretraining
- 中文标题:可预测的规模:第一部分——大型语言模型预训练中的最优超参数缩放规律
- 发布日期:2025-03-06 18:58:29+00:00
- 作者:Houyi Li, Wenzheng Zheng, Jingcheng Hu, Qiufeng Wang, Hanshan Zhang, Zili Wang, Yangshijie Xu, Shuigeng Zhou, Xiangyu Zhang, Daxin Jiang
- 分类:cs.LG, cs.AI, F.2.2; I.2.7
- 原文链接:http://arxiv.org/abs/2503.04715v1
中文摘要:大型语言模型(LLMs)在各种任务中的出色能力现已得到广泛认可,但其有效部署需要仔细的超参数优化。通过在不同配置下进行广泛的网格搜索实验,我们发现了控制这些超参数的普适缩放规律:最佳学习率与模型参数和数据规模呈幂律关系,而最佳批量大小主要与数据规模相关。我们的分析揭示了在固定模型和数据规模条件下,超参数的优化景观是凸的。这种凸性意味着存在一个最优超参数平台。我们为社区贡献了一个通用的即插即用最优超参数工具。其在测试集上的估计值与通过穷举搜索找到的全局最优LLM性能仅相差0.07%。这些规律在模型稀疏性、训练数据分布和模型形状的变化中表现出显著的鲁棒性。据我们所知,这是首次统一不同模型形状和结构(如专家混合模型和密集Transformer)并建立跨不同数据分布的最优超参数缩放规律的工作。这一详尽的优化过程需要大量计算资源,使用了近百万个NVIDIA H800 GPU小时从头训练了3,700个不同规模和超参数的LLM,并消耗了约100万亿个token。为了促进可重复性和进一步研究,我们将通过指定仓库https://step-law.github.io/逐步发布所有损失测量值和模型检查点。
摘要
- 原文标题:Teach YOLO to Remember: A Self-Distillation Approach for Continual Object Detection
- 中文标题:教YOLO记住:一种用于持续目标检测的自蒸馏方法
- 发布日期:2025-03-06 18:31:41+00:00
- 作者:Riccardo De Monte, Davide Dalle Pezze, Gian Antonio Susto
- 分类:cs.CV
- 原文链接:http://arxiv.org/abs/2503.04688v1
中文摘要:实时目标检测器如YOLO在大型数据集上经过多轮训练后表现出色。然而,在数据逐步到达的现实场景中,神经网络会遭受灾难性遗忘,导致先前学到的知识丢失。为了解决这一问题,先前的研究探索了在持续目标检测(CLOD)中进行类增量学习(CIL)的策略,大多数方法集中在两阶段目标检测器上。然而,现有研究表明,对于像YOLO这样的一阶段无锚点检测器,由于回归输出的噪声,学习而不遗忘(LwF)可能无效,这可能导致传递损坏的知识。在本研究中,我们提出了YOLO LwF,一种专为基于YOLO的持续目标检测设计的自蒸馏方法。我们证明,当与回放记忆结合时,YOLO LwF显著减轻了遗忘。与之前的方法相比,它在VOC和COCO基准测试上分别提高了mAP +2.1%和+2.9%,达到了最先进的性能。
摘要
- 原文标题:Whole-Body Model-Predictive Control of Legged Robots with MuJoCo
- 中文标题:基于MuJoCo的腿式机器人全身模型预测控制
- 发布日期:2025-03-06 16:59:06+00:00
- 作者:John Z. Zhang, Taylor A. Howell, Zeji Yi, Chaoyi Pan, Guanya Shi, Guannan Qu, Tom Erez, Yuval Tassa, Zachary Manchester
- 分类:cs.RO, cs.SY, eess.SY
- 原文链接:http://arxiv.org/abs/2503.04613v1
中文摘要:我们展示了一种非常简单的全身模型预测控制(MPC)方法在四足机器人和双足机器人上的惊人实际效果:使用MuJoCo动力学和有限差分近似导数的迭代LQR(iLQR)算法。基于之前在模拟中使用MuJoCo进行基于模型的行为合成以及运动和控制任务的成功经验,我们展示了这些策略可以轻松推广到现实世界,几乎不需要考虑从模拟到现实的转换。我们的基线方法在各种硬件实验中实现了实时全身MPC,包括动态四足运动、四足机器人用两条腿行走以及全尺寸双足人形机器人的运动。我们希望这种易于复现的硬件基线能够降低现实世界全身MPC研究的入门门槛,并为加速社区研究速度做出贡献。我们的代码和实验视频将在线提供:https://johnzhang3.github.io/mujoco_ilqr
摘要
- 原文标题:TAIL: Text-Audio Incremental Learning
- 中文标题:TAIL:文本-音频增量学习
- 发布日期:2025-03-06 09:39:36+00:00
- 作者:Yingfei Sun, Xu Gu, Wei Ji, Hanbin Zhao, Hao Fei, Yifang Yin, Roger Zimmermann
- 分类:cs.SD, cs.AI, cs.CV, eess.AS, I.2
- 原文链接:http://arxiv.org/abs/2503.04258v1
中文摘要:许多研究结合文本和音频来捕捉多模态信息,但它们忽视了模型在新数据集上的泛化能力。引入新数据集可能会影响原始数据集的特征空间,导致灾难性遗忘。同时,大模型参数会显著影响训练性能。为了解决这些限制,我们引入了一种称为文本-音频增量学习(TAIL)任务的新任务,用于文本-音频检索,并提出了一种新方法PTAT,即用于音频-文本增量学习的提示调优。该方法利用提示调优来优化模型参数,同时结合音频-文本相似性和特征蒸馏模块,有效缓解灾难性遗忘。我们在AudioCaps、Clotho、BBC Sound Effects和Audioset数据集上对我们的方法和之前的增量学习方法进行了基准测试,我们的方法显著优于之前的方法,特别是在旧数据集上表现出更强的抗遗忘能力。与全参数微调(顺序)方法相比,我们的模型仅需要其参数的2.42%,性能提高了4.46%。
摘要
- 原文标题:UniNet: A Unified Multi-granular Traffic Modeling Framework for Network Security
- 中文标题:UniNet:一种统一的网络流量多粒度建模框架
- 发布日期:2025-03-06 07:39:37+00:00
- 作者:Binghui Wu, Dinil Mon Divakaran, Mohan Gurusamy
- 分类:cs.CR, cs.LG, cs.NI
- 原文链接:http://arxiv.org/abs/2503.04174v1
中文摘要:随着现代网络因多样化设备、加密协议和不断演变的威胁而变得越来越复杂,网络流量分析变得至关重要。现有的机器学习模型通常仅依赖于数据包或流的单一表示,限制了其捕捉对稳健分析至关重要的上下文关系的能力。此外,针对监督学习、半监督学习和无监督学习的任务特定架构导致在适应不同数据格式和安全任务时效率低下。为了解决这些问题,我们提出了UniNet,一个统一的框架,引入了一种新颖的多粒度流量表示(T-Matrix),集成了会话、流和数据包级别的特征,以提供全面的上下文信息。结合T-Attent,一个轻量级的基于注意力机制的模型,UniNet能够高效地学习适用于多种安全任务的潜在嵌入。通过对四个关键网络安全和隐私问题——异常检测、攻击分类、物联网设备识别和加密网站指纹识别——的广泛评估,UniNet在性能上显著优于现有方法,实现了更高的准确性、更低的误报率和更好的可扩展性。通过解决单级模型的局限性并统一流量分析范式,UniNet为现代网络安全设定了新的基准。
摘要
- 原文标题:Mapping bipartite networks into multidimensional hyperbolic spaces
- 中文标题:将二分网络映射到多维双曲空间
- 发布日期:2025-03-06 10:59:26+00:00
- 作者:Robert Jankowski, Roya Aliakbarisani, M. Ángeles Serrano, Marián Boguñá
- 分类:physics.soc-ph, cs.SI
- 原文链接:http://arxiv.org/abs/2503.04316v1
中文摘要:二分网络出现在许多现实世界的场景中,连接两个不同集合的实体。它们通常通过单模投影进行分析,但这种投影可能会引入人为的相关性和夸大的聚类,掩盖真实的底层结构。在本文中,我们提出了一种二分网络的几何模型,利用高水平的二分四环作为聚类度量,将两种节点类型放置在同一个相似性空间中,其中链接概率随距离减小。此外,我们引入了B-Mercator算法,该算法从二分结构中推断节点位置。我们在多个数据集上评估其性能,展示了生成的嵌入如何改进机器学习中的节点分类和基于距离的链接预测等下游任务。这些双曲嵌入还能够生成节点特征与现实世界非常相似的合成网络,从而在允许安全数据共享的同时保护敏感信息。此外,我们展示了如何通过保留二分结构避免基于投影技术的缺陷,从而获得更准确的描述和更好的性能。我们的方法为揭示复杂二分系统中的隐藏几何提供了一个稳健的框架。
摘要
- 原文标题:Universality of Layer-Level Entropy-Weighted Quantization Beyond Model Architecture and Size
- 中文标题:超越模型架构和大小的层级熵加权量化的普适性
- 发布日期:2025-03-06 18:54:32+00:00
- 作者:Alireza Behtash, Marijan Fofonjka, Ethan Baird, Tyler Mauer, Hossein Moghimifam, David Stout, Joel Dennison
- 分类:cs.LG, cs.AI
- 原文链接:http://arxiv.org/abs/2503.04704v1
中文摘要:我们提出了一种新颖的选择性模型量化方法,该方法超越了针对大型语言模型(LLMs)的架构特定和大小依赖的压缩方法的限制,使用熵加权量化(EWQ)。通过分析跨 Transformer 块的熵分布,EWQ确定哪些块可以安全地量化而不会导致显著的性能下降,且独立于模型架构或大小。我们的方法优于均匀量化方法,在保持大规模多任务语言理解(MMLU)准确率得分在未量化模型的0.5%以内的同时,将内存使用量减少了高达18%。我们在多个架构(从1.6B到70B参数)上展示了EWQ的有效性,展示了无论模型规模或架构设计如何,在质量-压缩权衡方面的一致改进。EWQ的一个令人惊讶的发现是,与未量化模型相比,它能够降低困惑度,这表明通过选择性精度降低存在有益的规范化。这一改进在不同模型家族中都成立,表明层级熵与最佳精度要求之间存在基本关系。此外,我们引入了FastEWQ,一种用于熵分布分析的快速方法,无需加载模型权重。该技术利用了跨各种架构和规模的熵分布的普遍特征,能够在保持80%分类准确率的同时,实现近乎即时的量化决策。我们的结果表明,有效的量化策略可以独立于特定的架构选择或模型大小而开发,为高效的LLM部署开辟了新的可能性。
摘要
- 原文标题:Non-parametric kernel density estimation of magnitude distribution for the analysis of seismic hazard posed by anthropogenic seismicity
- 中文标题:非参数核密度估计在人为地震活动震级分布分析中的应用
- 发布日期:2025-03-06 12:43:18+00:00
- 作者:Francis Tong, Stanisław Lasocki, Beata Orlecka-Sikora
- 分类:physics.geo-ph, stat.AP
- 原文链接:http://arxiv.org/abs/2503.04393v1
中文摘要:频繁观察到的人为地震震级分布与古登堡-里希特关系的显著偏差,要求采用替代的估计方法进行概率地震危险性评估。我们评估了五种非参数核密度估计(KDE)方法,这些方法应用于从四种震级分布模型中抽取的模拟样本:指数分布、凹双指数分布、凸双指数分布以及指数-高斯分布。后三种分布代表了由于地壳厚度有限和特征地震效应导致的与古登堡-里希特关系的偏差。假设的与指数分布的偏差从未超过实际中遇到的偏差。研究的KDE方法包括Silverman和Scott规则(结合Abramson带宽调整)、两种基于扩散的方法(ISJ和diffKDE)以及adaptiveKDE,后者将带宽估计表述为一个优化问题。我们评估了这些方法在震级2到6、样本量400到5000的情况下的表现,使用了100,000次模拟的平均积分平方误差(MISE)。通过样本量为1000的平均重现周期(MRP)说明了它们在危险性评估中的适用性。在测试的方法中,diffKDE为较大震级提供了最准确的累积分布函数估计。即使数据来自指数分布,当样本量至少为1000时,diffKDE的表现与最大似然估计相当。鉴于人为地震通常偏离指数模型,我们建议在样本量足够的情况下,使用diffKDE进行概率地震危险性评估。
摘要
- 原文标题:Measurement of the Branching Fraction of $Λ_c^+ \to p K_S^0 π^0$ at Belle
- 中文标题:Belle实验中对$Λ_c^+ \to p K_S^0 π^0$分支比的测量
- 发布日期:2025-03-06 12:16:01+00:00
- 作者:The Belle, Belle II Collaborations, :, I. Adachi, L. Aggarwal, H. Ahmed, J. K. Ahn, H. Aihara, N. Akopov, M. Alhakami, A. Aloisio, N. Althubiti, M. Angelsmark, N. Anh Ky, D. M. Asner, H. Atmacan, T. Aushev, V. Aushev, M. Aversano, R. Ayad, V. Babu, H. Bae, N. K. Baghel, S. Bahinipati, P. Bambade, Sw. Banerjee, M. Barrett, M. Bartl, J. Baudot, A. Baur, A. Beaubien, F. Becherer, J. Becker, J. V. Bennett, F. U. Bernlochner, V. Bertacchi, M. Bertemes, E. Bertholet, M. Bessner, S. Bettarini, V. Bhardwaj, B. Bhuyan, F. Bianchi, T. Bilka, D. Biswas, A. Bobrov, D. Bodrov, A. Bolz, A. Bondar, J. Borah, A. Boschetti, A. Bozek, M. Bračko, P. Branchini, R. A. Briere, T. E. Browder, A. Budano, S. Bussino, Q. Campagna, M. Campajola, L. Cao, G. Casarosa, C. Cecchi, J. Cerasoli, M. -C. Chang, P. Chang, P. Cheema, B. G. Cheon, K. Chilikin, K. Chirapatpimol, H. -E. Cho, K. Cho, S. -J. Cho, S. -K. Choi, S. Choudhury, J. Cochran, L. Corona, J. X. Cui, E. De La Cruz-Burelo, S. A. De La Motte, G. De Nardo, G. De Pietro, R. de Sangro, M. Destefanis, S. Dey, R. Dhamija, A. Di Canto, F. Di Capua, J. Dingfelder, Z. Doležal, I. Domínguez Jiménez, T. V. Dong, D. Dossett, S. Dubey, K. Dugic, G. Dujany, P. Ecker, D. Epifanov, J. Eppelt, P. Feichtinger, T. Ferber, T. Fillinger, C. Finck, G. Finocchiaro, F. Forti, A. Frey, B. G. Fulsom, A. Gabrielli, E. Ganiev, M. Garcia-Hernandez, G. Gaudino, V. Gaur, A. Gaz, A. Gellrich, G. Ghevondyan, D. Ghosh, H. Ghumaryan, G. Giakoustidis, R. Giordano, A. Giri, P. Gironella Gironell, A. Glazov, B. Gobbo, R. Godang, O. Gogota, P. Goldenzweig, E. Graziani, D. Greenwald, Z. Gruberová, Y. Guan, K. Gudkova, I. Haide, S. Halder, Y. Han, C. Harris, K. Hayasaka, H. Hayashii, S. Hazra, M. T. Hedges, A. Heidelbach, I. Heredia de la Cruz, M. Hernández Villanueva, T. Higuchi, M. Hoek, M. Hohmann, R. Hoppe, P. Horak, C. -L. Hsu, T. Humair, T. Iijima, K. Inami, N. Ipsita, A. Ishikawa, R. Itoh, M. Iwasaki, P. Jackson, D. Jacobi, W. W. Jacobs, E. -J. Jang, S. Jia, Y. Jin, A. Johnson, K. K. Joo, H. Junkerkalefeld, M. Kaleta, J. Kandra, K. H. Kang, G. Karyan, T. Kawasaki, F. Keil, C. Ketter, C. Kiesling, C. -H. Kim, D. Y. Kim, J. -Y. Kim, K. -H. Kim, Y. -K. Kim, Y. J. Kim, H. Kindo, K. Kinoshita, P. Kodyš, T. Koga, S. Kohani, K. Kojima, A. Korobov, S. Korpar, E. Kovalenko, P. Križan, P. Krokovny, T. Kuhr, Y. Kulii, D. Kumar, M. Kumar, R. Kumar, K. Kumara, T. Kunigo, A. Kuzmin, Y. -J. Kwon, S. Lacaprara, Y. -T. Lai, K. Lalwani, T. Lam, J. S. Lange, T. S. Lau, M. Laurenza, R. Leboucher, F. R. Le Diberder, M. J. Lee, C. Lemettais, P. Leo, C. Li, L. K. Li, Q. M. Li, W. Z. Li, Y. Li, Y. B. Li, Y. P. Liao, J. Libby, J. Lin, S. Lin, M. H. Liu, Q. Y. Liu, Y. Liu, Z. Q. Liu, D. Liventsev, S. Longo, C. Lyu, Y. Ma, C. Madaan, M. Maggiora, S. P. Maharana, R. Maiti, G. Mancinelli, R. Manfredi, E. Manoni, M. Mantovano, D. Marcantonio, S. Marcello, C. Marinas, C. Martellini, A. Martens, A. Martini, T. Martinov, L. Massaccesi, M. Masuda, D. Matvienko, S. K. Maurya, M. Maushart, J. A. McKenna, R. Mehta, F. Meier, D. Meleshko, M. Merola, C. Miller, M. Mirra, S. Mitra, K. Miyabayashi, H. Miyake, R. Mizuk, G. B. Mohanty, S. Mondal, S. Moneta, H. -G. Moser, R. Mussa, I. Nakamura, M. Nakao, H. Nakazawa, Y. Nakazawa, M. Naruki, Z. Natkaniec, A. Natochii, M. Nayak, G. Nazaryan, M. Neu, S. Nishida, S. Ogawa, H. Ono, Y. Onuki, F. Otani, P. Pakhlov, G. Pakhlova, E. Paoloni, S. Pardi, K. Parham, H. Park, J. Park, K. Park, S. -H. Park, B. Paschen, A. Passeri, S. Patra, T. K. Pedlar, I. Peruzzi, R. Peschke, R. Pestotnik, M. Piccolo, L. E. Piilonen, P. L. M. Podesta-Lerma, T. Podobnik, S. Pokharel, C. Praz, S. Prell, E. Prencipe, M. T. Prim, I. Prudiiev, H. Purwar, P. Rados, G. Raeuber, S. Raiz, N. Rauls, K. Ravindran, J. U. Rehman, M. Reif, S. Reiter, M. Remnev, L. Reuter, D. Ricalde Herrmann, I. Ripp-Baudot, G. Rizzo, M. Roehrken, J. M. Roney, A. Rostomyan, N. Rout, D. A. Sanders, S. Sandilya, L. Santelj, Y. Sato, V. Savinov, B. Scavino, J. Schmitz, S. Schneider, G. Schnell, M. Schnepf, K. Schoenning, C. Schwanda, A. J. Schwartz, Y. Seino, A. Selce, K. Senyo, J. Serrano, M. E. Sevior, C. Sfienti, W. Shan, C. Sharma, X. D. Shi, T. Shillington, T. Shimasaki, J. -G. Shiu, D. Shtol, A. Sibidanov, F. Simon, J. B. Singh, J. Skorupa, M. Sobotzik, A. Soffer, A. Sokolov, E. Solovieva, S. Spataro, B. Spruck, W. Song, M. Starič, P. Stavroulakis, S. Stefkova, R. Stroili, J. Strube, Y. Sue, M. Sumihama, K. Sumisawa, W. Sutcliffe, N. Suwonjandee, H. Svidras, M. Takahashi, M. Takizawa, U. Tamponi, K. Tanida, F. Tenchini, A. Thaller, O. Tittel, R. Tiwary, E. Torassa, K. Trabelsi, I. Tsaklidis, M. Uchida, I. Ueda, T. Uglov, K. Unger, Y. Unno, K. Uno, S. Uno, P. Urquijo, Y. Ushiroda, S. E. Vahsen, R. van Tonder, M. Veronesi, A. Vinokurova, V. S. Vismaya, L. Vitale, V. Vobbilisetti, R. Volpe, A. Vossen, M. Wakai, S. Wallner, M. -Z. Wang, X. L. Wang, Z. Wang, A. Warburton, M. Watanabe, S. Watanuki, C. Wessel, E. Won, X. P. Xu, B. D. Yabsley, S. Yamada, W. Yan, S. B. Yang, J. Yelton, J. H. Yin, K. Yoshihara, C. Z. Yuan, J. Yuan, L. Zani, F. Zeng, B. Zhang, V. Zhilich, J. S. Zhou, Q. D. Zhou, L. Zhu, V. I. Zhukova, R. Žlebčík
- 分类:hep-ex
- 原文链接:http://arxiv.org/abs/2503.04371v1
中文摘要:我们报告了使用Belle实验的980 fb$^{-1}$的$e^+e^-$数据对分支比$\mathcal{B}(\Lambda_c^+\to p K_S^0 \pi^0)/\mathcal{B}(\Lambda_c^+\to p K^- \pi^+)$的精确测量。我们得到的值为$\mathcal{B}(\Lambda_c^+\to p K_S^0 \pi^0)/\mathcal{B}(\Lambda_c^+\to p K^- \pi^+)=0.339\pm 0.002\pm 0.009$,其中第一和第二不确定性分别为统计和系统不确定性。这一Belle结果与之前CLEO实验的测量结果一致,但精度提高了五倍。通过将我们的结果与世界平均$\mathcal{B}(\Lambda_c^+\to p K^- \pi^+)$结合,我们得到了绝对分支比$\mathcal{B}(\Lambda_c^+\to p K_S^0 \pi^0)=(2.12\pm 0.01\pm 0.05 \pm 0.10)\%$,其中不确定性分别为统计、系统以及绝对分支比尺度$\mathcal{B}(\Lambda_c^+\to p K^- \pi^+)$的不确定性。这一测量可以为重子衰变中的强子衰变机制提供新的见解。
摘要
- 原文标题:Preference for evolving dark energy in light of the galaxy bispectrum
- 中文标题:基于星系双谱的演化暗能量偏好
- 发布日期:2025-03-06 16:45:49+00:00
- 作者:Zhiyu Lu, Théo Simon, Pierre Zhang
- 分类:astro-ph.CO, gr-qc, hep-ph, hep-th
- 原文链接:http://arxiv.org/abs/2503.04602v1
中文摘要:我们使用由$(w_0, w_a)$参数化的暗能量状态方程$w(z)$分析了DESI之前的聚类数据,发现当与来自Planck的宇宙微波背景数据和来自Pantheon+、Union3或DESY5的超新星数据结合时,相较于宇宙常数$\Lambda$,存在$2.8-3.9\sigma$的偏好支持演化的暗能量。我们的约束与DESI Y1结果一致,是基于SDSS/BOSS星系功率谱和双谱,使用大尺度结构有效场论(EFTofLSS)在一环水平上推导的。证据在不同分析变化中保持稳健,但若没有一环双谱则消失。当将DESI重子声学振荡与BOSS全形状数据结合时,同时对后者中的声速视界进行边缘化以防止未考虑的关联,显著性增加到$3.7-4.4\sigma$,具体取决于超新星数据集。使用数据驱动的$w(z)$重建,我们展示了证据来源于多个红移处对$\Lambda$的偏离。此外,我们的发现在暗能量有效场论(EFTofDE)框架内进行了解释,从中我们明确追踪了EFTofLSS预测中的非标准时间演化。对于$w < -1$区域内的微扰稳定理论,当存在高阶导数修正时,证据在聚类极限$(c_s^2 \rightarrow 0)$中持续存在,并且在考虑额外的EFTofDE参数时,在准静态极限$(c_s^2 \rightarrow 1)$中也存在。
摘要
- 原文标题:Numerical Study On Temperature Variations Of Superheated Steam Flowing Through A Regulation Valve
- 中文标题:过热蒸汽流经调节阀的温度变化数值研究
- 发布日期:2025-03-06 08:37:41+00:00
- 作者:Zhe-hui Ma, Hang-ye Zhang, Chuang Liu, Ming Zhang, Jin-yuan Qian
- 分类:physics.flu-dyn
- 原文链接:http://arxiv.org/abs/2503.04209v1
中文摘要:过热蒸汽广泛应用于各种能源系统中,特别是在发电厂、化工行业以及其他需要高温高压蒸汽以实现高效能量转换和过程控制的应用中。在这些系统中,调节阀是控制蒸汽流动、调节其压力和温度以确保安全高效运行的关键组件。准确理解和预测调节阀内的温度变化对于优化其性能和提高整体系统效率至关重要。本研究通过计算流体动力学(CFD)模拟结合本征正交分解(POD)技术,研究了过热蒸汽流经调节阀时的温度变化。分析首先检查了内部流场参数,包括温度和压力,以了解阀门内的整体流体动力学。POD用于降低CFD结果的维度,奇异值分解(SVD)用于提取捕捉传热和温度波动关键流动结构的主导模态。POD分析表明,最具影响力的模态与高湍流强度和显著温度梯度区域相关,这些区域对蒸汽流经调节阀的热性能至关重要。将POD应用于3D CFD结果是一种新颖的方法,特别是对于复杂流体流动模型(如蒸汽流经调节阀)而言。本研究的见解对能源系统中温度和压力调节阀的设计和优化具有实际意义,为提高这些系统的效率和可靠性提供了理论基础。
摘要
- 原文标题:The JARVIS Infrastructure is All You Need for Materials Design
- 中文标题:JARVIS 基础设施是材料设计所需的一切
- 发布日期:2025-03-06 06:26:32+00:00
- 作者:Kamal Choudhary
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.04133v1
中文摘要:联合自动化多种集成模拟资源库(JARVIS)是一个综合性的基础设施,提供数据库、工具、教程和基准,用于多尺度、多模态、正向和逆向材料设计。它强调开放获取原则和可重复性,整合了理论和实验方法,如密度泛函理论、量子蒙特卡罗、紧束缚模型、经典力场以及机器学习方法——包括指纹识别、图神经网络和变压器模型。其实验数据收集涵盖了低温学、显微镜和衍射,覆盖了金属、半导体、绝缘体、超导体、碳捕获系统、高强度化合物、低维材料、异质结构和缺陷等材料。JARVIS通过开放数据集、网络应用程序、可执行脚本和同行评审的出版物传播资源,确保广泛的访问性和可重复性。它在全球范围内被广泛采用,促进了数百万数据和工具的下载。通过将多种方法和数据统一在一个平台下,JARVIS推动了基础发现和现实世界的创新,推进了传统和数据驱动的材料设计。
摘要
- 原文标题:HERACLES++: a multi-dimensional Eulerian code for exascale computing
- 中文标题:HERACLES++:面向百亿亿次计算的多维欧拉代码
- 发布日期:2025-03-06 13:37:50+00:00
- 作者:Lou Roussel-Hard, Edouard Audit, Luc Dessart, Thomas Padioleau, Yushan Wang
- 分类:astro-ph.SR, astro-ph.GA, astro-ph.HE, astro-ph.IM, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.04428v1
中文摘要:多维天体物理流体的数值模拟面临着巨大的挑战。然而,百亿亿次计算的发展显著提升了计算能力,推动了能够充分利用这些资源的新代码的开发。在本文中,我们介绍了HERACLES++,这是一种具有高可移植性的新型流体动力学代码,针对不同架构的百亿亿次计算机进行了优化,能够在CPU和GPU上高效运行。该代码采用欧拉方法,并使用Godunov有限体积法来求解流体动力学方程,从而确保在捕捉激波和不连续性时的准确性。它包含不同的黎曼求解器、状态方程和重力求解器。它可以在笛卡尔坐标系和球坐标系中工作,支持1维、2维或3维模拟,并使用被动标量来处理多种气体。该代码允许用户提供加热或冷却项,以处理各种天体物理场景。除了常规的基准测试系列外,我们还使用HERACLES++模拟了超新星激波在红超巨星包层中的传播,从核心坍缩后的几分钟直到激波出现。在1维情况下,HERACLES++的结果与相同配置下的V1D结果一致。在3维情况下,瑞利-泰勒不稳定性的发展通过引入密度和成分波动以及湍流,修改了1维图像。通过聚焦于一个楔形区域而不是整个立体角,以及能够在大量GPU上运行HERACLES++,使得我们能够以亚度分辨率对3维超新星抛射物进行长期模拟。未来的发展目标是将HERACLES++扩展为辐射流体动力学代码。
摘要
- 原文标题:Matrix Factorization for Inferring Associations and Missing Links
- 中文标题:矩阵分解用于推断关联和缺失链接
- 发布日期:2025-03-06 18:22:46+00:00
- 作者:Ryan Barron, Maksim E. Eren, Duc P. Truong, Cynthia Matuszek, James Wendelberger, Mary F. Dorn, Boian Alexandrov
- 分类:cs.LG, cs.AI, cs.LO
- 原文链接:http://arxiv.org/abs/2503.04680v1
中文摘要:缺失链接预测是一种网络分析方法,应用于推荐系统、生物学、社会科学、网络安全、信息检索以及知识图谱中的人工智能(AI)推理。缺失链接预测通过分析观察到的模式和关系,识别网络中未观察到但可能存在的连接。在扩散检测中,这有助于识别和描述国家与非国家行为者获取核武器或相关技术的企图——这是全球安全中一项极具挑战性但至关重要的任务。非负矩阵分解(NMF)和逻辑矩阵分解(LMF)等降维技术虽然有效,但需要选择矩阵秩参数,即隐藏特征的数量k,以避免过拟合或欠拟合。我们引入了新的加权(WNMFk)、布尔(BNMFk)和推荐(RNMFk)矩阵分解方法,并结合逻辑分解的集成变体,用于链接预测。我们的方法通过使用改进的自举方法和不确定性量化(UQ)评估稳定性和准确性,自动确定模型秩估计,评估随机扰动下的预测可靠性。我们结合Otsu阈值选择和k-means聚类进行布尔矩阵分解,并将其与基于坐标下降的布尔阈值方法进行比较。我们的实验突出了秩k选择的影响,评估了不同测试集大小下的模型性能,并展示了UQ在可靠预测中的优势。我们在三个合成数据集(布尔和均匀分布)上验证了我们的方法,并在五个真实世界的蛋白质-蛋白质相互作用网络上与LMF和对称LMF(symLMF)进行了基准测试,展示了改进的预测性能。
摘要
- 原文标题:Computer-Assisted Proofs of Solitons in Bose-Einstein Condensates
- 中文标题:计算机辅助证明玻色-爱因斯坦凝聚体中的孤子
- 发布日期:2025-03-06 18:49:04+00:00
- 作者:Miguel Ayala, Carlos García Azpeitia, Jean-Philippe Lessard
- 分类:math.DS, math.AP
- 原文链接:http://arxiv.org/abs/2503.04701v1
中文摘要:我们严格证明了在一维Gross-Pitaevskii方程(GP方程)中具有周期势的间隙孤子的存在性。这些非线性局域解出现在谱隙中,并在理解玻色-爱因斯坦凝聚体(BECs)中起着关键作用。为了证明它们,我们将问题重新表述为在高维动力系统中寻找同宿轨道。然后,我们使用计算机辅助证明技术,结合泛函分析框架,严格验证数值近似的同宿轨道。这项工作将计算证据与形式数学证明相结合,为研究GP方程中的孤子提供了坚实的基础。
摘要
- 原文标题:A Short Survey of the Well-posedness of the Two-dimensional Burgers' Equation
- 中文标题:二维Burgers方程适定性研究简评
- 发布日期:2025-03-06 14:19:14+00:00
- 作者:Xiang Zhang, Shuhan Xie, Yule Sun
- 分类:math.AP
- 原文链接:http://arxiv.org/abs/2503.04467v1
中文摘要:在本文中,我们利用无限维动力系统的框架,建立了二维Burgers方程解的存在性和唯一性。二维Burgers方程模拟了非线性平流和粘性耗散之间的相互作用,其形式为:$$ u_{t} + u \cdot \nabla u = \nu \Delta u + f, $$ 其中 $ u = (u_1, u_2) $ 是速度场,$ \nu > 0 $ 是粘性系数,$ f $ 表示外力。我们主要采用Galerkin方法将偏微分方程转化为常微分方程。此外,通过使用Sobolev空间、能量估计和紧性论证,我们严格证明了在适当的初始条件和边界条件下全局解的存在性及其唯一性。
摘要
- 原文标题:Faster Distributed $Δ$-Coloring via Ruling Subgraphs
- 中文标题:通过支配子图实现更快的分布式 $Δ$-着色
- 发布日期:2025-03-06 11:07:15+00:00
- 作者:Yann Bourreau, Sebastian Brandt, Alexandre Nolin
- 分类:cs.DC, cs.DS
- 原文链接:http://arxiv.org/abs/2503.04320v1
中文摘要:布鲁克斯定理指出,除了奇环和团之外,所有连通图都可以用 $\Delta$ 种颜色着色,其中 $\Delta$ 是图的最大度数。这种着色已被证明允许非平凡的分布式算法 [Panconesi 和 Srinivasan, Combinatorica 1995],并在分布式计算文献中得到了深入研究。特别是,已知任何计算 $\Delta$-着色的确定性算法在 LOCAL 模型中需要 $\Omega(\log n)$ 轮 [Chang, Kopelowitz, 和 Pettie, FOCS 2016],并且这个下界已经在常数度图上成立。相比之下,在这种情况下的最佳上界是由一个 $O(\log^2 n)$ 轮的确定性算法给出的,该算法可以从大约三十年前的 [Awerbuch, Goldberg, Luby, 和 Plotkin, FOCS 1989] 和 [Panconesi 和 Srinivasan, Combinatorica 1995] 的工作中推断出来,这引发了关于常数度设置中 $\Delta$-着色的真实复杂性的基本问题。我们通过提供一个几乎最优的确定性 $O(\log n \log^* n)$ 轮算法来几乎完全回答这个长期存在的问题,该算法与下界匹配,仅相差一个 $\log^* n$ 因子。类似地,在随机化 LOCAL 模型中,我们提供了一个 $O(\log \log n \log^* n)$ 轮的算法,改进了现有的 $O(\log^2 \log n)$ 轮的上界 [Ghaffari, Hirvonen, Kuhn, 和 Maus, Distributed Computing 2021],并且几乎匹配了 $\Omega(\log \log n)$ 轮的下界 [BFHKLRSU, STOC 2016]。我们的结果在几个重要的开放问题和猜想上取得了进展。获得我们结果的一个关键因素是引入了统治子图族作为一种新颖的工具,用于打破图子结构之间的对称性,我们预计这将具有独立的意义。
摘要
- 原文标题:Influence of elastic deformations on body-wave velocity in solids: a case study considering shear deformations in concrete
- 中文标题:弹性变形对固体中体波速度的影响:以混凝土剪切变形为例
- 发布日期:2025-03-06 11:57:49+00:00
- 作者:Hao Cheng, Cornelis Weemstra, Katrin Löer, Max A. N. Hendriks, Yuguang Yang
- 分类:physics.class-ph, physics.app-ph
- 原文链接:http://arxiv.org/abs/2503.04354v1
中文摘要:本文利用声弹性理论框架研究了弹性变形对可压缩各向同性材料中体波速度的影响。具体而言,它研究了在波传播方向定义的坐标系中,与主变形轴成一定角度传播的体波,其中剪切变形和法向变形同时存在。尽管已有许多研究涉及这一主题,但理论推导尚未就波速对施加的剪切应力和应变的响应得出明确结论。为了得出混凝土中体波的具体结论,我们以混凝土为介质分析了三个例子。主要发现是,在混凝土材料中,当体波在剪切变形平面上传播时,纵波速度的变化主要归因于法向应变的变化,而横波速度则显著受到法向应变和剪切应变的共同影响。这一发现可以增强声弹性理论在平面应力状态下检测主应力大小和方向的应用。
摘要
- 原文标题:Assessing Student Adoption of Generative Artificial Intelligence across Engineering Education from 2023 to 2024
- 中文标题:评估2023年至2024年工程教育中学生对生成式人工智能的采用情况
- 发布日期:2025-03-06 18:42:36+00:00
- 作者:Jesan Ahammed Ovi, Gabe Fierro, C. Estelle Smith
- 分类:cs.HC
- 原文链接:http://arxiv.org/abs/2503.04696v1
中文摘要:生成式人工智能(GenAI)工具和模型有潜力重塑工程教育各个领域的教育需求、规范、实践和政策。关于工程学生如何采用GenAI的实证数据,而非轶事和假设,对于在学术培训期间建立对学生GenAI相关行为和需求的基础理解至关重要。这些数据还将帮助学术机构和工业雇主制定有效的GenAI应对策略。我们在2023年5月($n_1=601$)和2024年9月($n_2=862$)于美国科罗拉多矿业学院(一所小型工程类R-1大学)收集了两个具有代表性的调查样本,以解决以下研究问题:(RQ1)工程学生如何采用GenAI,包括促成GenAI使用的动机和人口统计因素;(RQ2)学生对GenAI的伦理担忧;(RQ3)学生对GenAI对自身、科学和社会的感知利益与危害。分析显示,从2023年到2024年,GenAI的采用率显著上升。学生主要利用GenAI工具来加深理解、提高工作质量并了解新兴技术。尽管大多数学生认为自己对GenAI的使用是合乎道德且有益的,但他们仍然对GenAI及其对社会的影响表达了重大担忧。我们收集了学生对“P(doom)”的估计,并发现了一个双峰分布。因此,我们表明,尽管随着时间的推移,矿业学院的学生越来越愿意探索GenAI,但他们对GenAI未来对工程劳动力和社会的影响持两极分化态度。我们讨论了这些发现对未来研究以及将GenAI整合到工程教育中的影响。
摘要
- 原文标题:Pervasive protonation of perovskite membranes made by the water-soluble sacrificial layer method
- 中文标题:通过水溶性牺牲层方法制备的钙钛矿膜的普遍质子化
- 发布日期:2025-03-06 08:21:09+00:00
- 作者:Umair Saeed, Felip Sandiumenge, Kumara Cordero-Edwards, Jessica Padilla-Pantoja, José Manuel Caicedo Roque, David Pesquera, José Santiso, Gustau Catalan
- 分类:cond-mat.mtrl-sci, physics.app-ph
- 原文链接:http://arxiv.org/abs/2503.04197v1
中文摘要:通过使用水溶性牺牲层的剥离方法制备钙钛矿氧化物自支撑薄膜(膜)具有吸引力,因为这些膜相对于传统的外延薄膜具有新的机械自由度。然而,关于其制备过程,特别是在蚀刻步骤中暴露于水对其性质的影响,知之甚少。在这里,我们研究了两种钙钛矿原型——反铁电PbZrO3和顺电SrTiO3的膜在水基蚀刻步骤中的影响。通过拉曼光谱和X射线衍射,我们发现氢渗透到钙钛矿结构中的证据。伴随着这种质子化,功能性质也发生了变化,两种材料在室温下都表现出类似铁电的行为,这在块体陶瓷或无氢薄膜中是不存在的。我们还发现,热退火可以用来将氢从膜中排出,从而恢复块体性质。这项工作的两个主要结论是:(i)任何通过牺牲层水解制备的钙钛矿膜都容易受到氢渗透(质子化)的影响,这可能导致功能性质发生重要但外在的变化;(ii)氢可以通过退火排出,并且应该通过退火排出以恢复内在行为。
摘要
- 原文标题:A Foundational Potential Energy Surface Dataset for Materials
- 中文标题:材料的基础势能面数据集
- 发布日期:2025-03-06 04:06:59+00:00
- 作者:Aaron D. Kaplan, Runze Liu, Ji Qi, Tsz Wai Ko, Bowen Deng, Janosh Riebesell, Gerbrand Ceder, Kristin A. Persson, Shyue Ping Ong
- 分类:cond-mat.mtrl-sci, physics.comp-ph
- 原文链接:http://arxiv.org/abs/2503.04070v1
中文摘要:准确的势能面(PES)描述对于材料的原子模拟至关重要。通用机器学习原子间势(UMLIPs)$^{1-3}$为周期表中PES建模提供了一种计算效率高的替代方案,相较于密度泛函理论(DFT)$^4$。然而,由于依赖于DFT弛豫数据$^{5,6}$,其准确性目前受到根本性限制。在此,我们引入了MatPES,这是一个基础的PES数据集,包含从281亿个分子动力学快照中精心采样的$\sim 400,000$个结构,涵盖了160亿个原子环境。我们展示了在适度规模的MatPES数据集上训练的UMLIPs可以在广泛的平衡、近平衡和分子动力学性质基准测试中与甚至超越先前在更大数据集上训练的模型。我们还引入了首个基于修订的正则化强约束和适当归一化(r$^2$SCAN)泛函$^7$的高保真PES数据集,显著改进了原子间键合的描述。开源的MatPES计划强调了材料科学中数据质量的重要性,并推动了社区驱动的广泛进展,以实现更可靠、可推广和高效的UMLIPs,用于大规模材料发现和设计。
摘要
- 原文标题:Ultrahigh free-electron Kerr nonlinearity in all-semiconductor waveguides for all-optical nonlinear modulation of mid-infrared light
- 中文标题:全半导体波导中的超高自由电子克尔非线性用于中红外光的全光非线性调制
- 发布日期:2025-03-06 18:57:25+00:00
- 作者:Gonzalo Álvarez-Pérez, Huatian Hu, Fangcheng Huang, Tadele Orbula Otomalo, Michele Ortolani, Cristian Ciracì
- 分类:physics.optics, quant-ph
- 原文链接:http://arxiv.org/abs/2503.04711v1
中文摘要:非线性光学波导,特别是那些利用光学克尔效应的波导,在推动下一代光子技术方面具有广阔前景。尽管克尔效应具有超快响应特性,但其固有的弱非线性限制了实际应用。本文研究了全半导体波导中的自由电子诱导克尔非线性,揭示了纵向体等离子体(固有的非局域激发)可以产生异常强的克尔非线性。我们特别开发了一种结合半经典流体动力学理论的非线性本征模分析方法,用于计算重掺杂半导体中自由电子量子行为引起的线性和非线性光学响应。这些波导实现了超过10$^7$ W$^{-1}$km$^{-1}$的超高非线性系数,并支持传播距离超过100 $\mu$m的长传播模式。此外,通过考虑粘弹性和非线性阻尼机制,我们验证了在实际条件下非线性响应的鲁棒性。最后,我们在马赫-曾德尔干涉仪中实现了全半导体波导,展示了通过自由电子克尔效应实现的高效非线性调制透射光谱。这项工作证明了重掺杂半导体中自由电子非线性在光子集成电路中的变革潜力,为可扩展的片上非线性纳米光子系统铺平了道路。
摘要
- 原文标题:Enhancing DUNE Physics Sensitivity with Light and Charge Calorimetry
- 中文标题:利用光和电荷量热法增强DUNE物理灵敏度
- 发布日期:2025-03-06 13:44:31+00:00
- 作者:Jogesh Rout, Suchismita Sahoo
- 分类:physics.ins-det, hep-ex, hep-ph
- 原文链接:http://arxiv.org/abs/2503.04432v1
中文摘要:我们研究了液态氩时间投影室中光量热法的潜力及其固有的自补偿特性,强调了其与传统的电荷量热法相比的优势。先前的研究表明,光量热法可以实现与先进的基于电荷的技术相当的能量分辨率,特别是对于GeV级中微子。在这项工作中,我们探索了光量热法与电荷量热法在DUNE中关键物理参数(包括CP破坏(CPV)和质量层次确定)的精确测量中的互补性。虽然电荷量热法在CP相位测量中提供了更高的分辨率,但光量热法独立地为CPV和质量层次敏感性提供了重要的见解。此外,我们的曝光与CPV敏感性研究表明,使用光量热法和电荷量热法比传统的基于TDR的重建方法更快地达到$5\sigma$的发现潜力。这些发现突出了光量热法作为一种简单而有效的重建方法的潜力,作为增强DUNE物理能力的补充方法。
摘要
- 原文标题:Capacitive response of biological membranes
- 中文标题:生物膜的电容响应
- 发布日期:2025-03-06 18:16:39+00:00
- 作者:Jafar Farhadi, Joshua B. Fernandes, Karthik Shekhar, Kranthi K. Mandadapu
- 分类:cond-mat.soft, physics.bio-ph, q-bio.SC
- 原文链接:http://arxiv.org/abs/2503.04677v1
中文摘要:我们提出了一个最小模型,用于分析通过阻塞电极施加阶跃电压时生物膜的电容响应。通过对基础电解质输运方程的微扰分析,我们表明跨膜电位的主导阶弛豫由电容时间尺度 ${\tau_{\rm C} =\dfrac{\lambda_{\rm D}L}{D}\left(\dfrac{2+\Gamma\delta^{\rm M}/L}{4+\Gamma\delta^{\rm M}/\lambda_{\rm D}}\right)}$ 控制,其中 $\lambda_{\rm D}$ 是德拜屏蔽长度,$L$ 是电解质宽度,$\Gamma$ 是电解质与膜的介电常数之比,$\delta^{\rm M}$ 是膜厚度,$D$ 是离子扩散系数。由于膜的低介电常数和有限厚度,该时间尺度明显短于裸电解质的传统 RC 时间尺度 ${\lambda_{\rm D} L / D}$。然而,在线性范围之外,体电解质中的盐扩散驱动了跨膜电位的二次非线性弛豫过程,其时间尺度为 ${\tau_{\rm L} =L^2/4\pi^2 D}$。一个简单的等效电路模型准确地捕捉了线性行为,并且微扰展开在整个观察到的生理跨膜电位范围内仍然适用。这些发现共同强调了更快的电容时间尺度和非线性效应对体扩散时间尺度在确定一系列生物系统的跨膜电位动态中的重要性。
摘要
- 原文标题:Quantifying the Reasoning Abilities of LLMs on Real-world Clinical Cases
- 中文标题:量化大语言模型在真实世界临床案例中的推理能力
- 发布日期:2025-03-06 18:35:39+00:00
- 作者:Pengcheng Qiu, Chaoyi Wu, Shuyu Liu, Weike Zhao, Ya Zhang, Yanfeng Wang, Weidi Xie
- 分类:cs.CL
- 原文链接:http://arxiv.org/abs/2503.04691v1
中文摘要:最新的推理增强型大语言模型(reasoning LLMs),如 DeepSeek-R1 和 OpenAI-o3,已经展示了显著的成功。然而,这种推理增强在高度专业的医学领域的应用尚未得到明确评估,特别是在不仅评估最终生成结果,还检查其推理过程质量方面。在本研究中,我们提出了 MedR-Bench,一个以推理为重点的医学评估基准,包含 1,453 个结构化患者案例,其推理参考来自病例报告。我们的基准涵盖了 13 个身体系统和 10 种专科疾病,包括常见和罕见疾病。在我们的评估中,我们引入了一个多功能框架,包含三个关键的临床阶段:评估建议、诊断决策和治疗计划,全面捕捉 LLMs 在整个患者医疗旅程中的表现。在指标方面,我们提出了一种新颖的代理系统,称为推理评估器(Reasoning Evaluator),旨在通过动态搜索和执行交叉引用检查,从效率、事实性和完整性的角度,以可扩展的方式自动化和客观量化自由文本推理响应。最终,我们评估了五种最先进的推理 LLMs,包括 DeepSeek-R1、OpenAI-o3-mini 等。我们的结果表明,当前的 LLMs 能够处理相对简单的诊断任务,并提供足够的关键评估结果,准确率通常超过 85%。然而,它们在更复杂的任务(如评估建议和治疗计划)上仍然存在困难。在推理方面,它们的推理过程通常是可靠的,事实性得分超过 90%,但常常忽略关键的推理步骤。我们的研究明确揭示了当前临床 LLMs 的进一步发展方向。