WikiEdge:ArXiv速递/2025-03-06

来自WikiEdge
Carole留言 | 贡献2025年3月7日 (五) 11:15的版本 (Updated page by Carole)
跳转到导航 跳转到搜索

摘要

  • 原文标题:Predictable Scale: Part I -- Optimal Hyperparameter Scaling Law in Large Language Model Pretraining
  • 中文标题:可预测的规模:第一部分——大型语言模型预训练中的最优超参数缩放规律
  • 发布日期:2025-03-06 18:58:29+00:00
  • 作者:Houyi Li, Wenzheng Zheng, Jingcheng Hu, Qiufeng Wang, Hanshan Zhang, Zili Wang, Yangshijie Xu, Shuigeng Zhou, Xiangyu Zhang, Daxin Jiang
  • 分类:cs.LG, cs.AI, F.2.2; I.2.7
  • 原文链接http://arxiv.org/abs/2503.04715v1

中文摘要大型语言模型(LLMs)在各种任务中的出色能力现已得到广泛认可,但其有效部署需要仔细的超参数优化。通过在不同配置下进行广泛的网格搜索实验,我们发现了控制这些超参数的普适缩放规律:最佳学习率模型参数数据规模幂律关系,而最佳批量大小主要与数据规模相关。我们的分析揭示了在固定模型和数据规模条件下,超参数的优化景观是的。这种凸性意味着存在一个最优超参数平台。我们为社区贡献了一个通用的即插即用最优超参数工具。其在测试集上的估计值与通过穷举搜索找到的全局最优LLM性能仅相差0.07%。这些规律在模型稀疏性训练数据分布模型形状的变化中表现出显著的鲁棒性。据我们所知,这是首次统一不同模型形状和结构(如专家混合模型密集Transformer)并建立跨不同数据分布的最优超参数缩放规律的工作。这一详尽的优化过程需要大量计算资源,使用了近百万个NVIDIA H800 GPU小时从头训练了3,700个不同规模和超参数的LLM,并消耗了约100万亿个token。为了促进可重复性和进一步研究,我们将通过指定仓库https://step-law.github.io/逐步发布所有损失测量值模型检查点

摘要

  • 原文标题:Teach YOLO to Remember: A Self-Distillation Approach for Continual Object Detection
  • 中文标题:教YOLO记住:一种用于持续目标检测的自蒸馏方法
  • 发布日期:2025-03-06 18:31:41+00:00
  • 作者:Riccardo De Monte, Davide Dalle Pezze, Gian Antonio Susto
  • 分类:cs.CV
  • 原文链接http://arxiv.org/abs/2503.04688v1

中文摘要:实时目标检测器如YOLO在大型数据集上经过多轮训练后表现出色。然而,在数据逐步到达的现实场景中,神经网络会遭受灾难性遗忘,导致先前学到的知识丢失。为了解决这一问题,先前的研究探索了在持续目标检测CLOD)中进行类增量学习CIL)的策略,大多数方法集中在两阶段目标检测器上。然而,现有研究表明,对于像YOLO这样的一阶段无锚点检测器,由于回归输出的噪声,学习而不遗忘LwF)可能无效,这可能导致传递损坏的知识。在本研究中,我们提出了YOLO LwF,一种专为基于YOLO的持续目标检测设计的自蒸馏方法。我们证明,当与回放记忆结合时,YOLO LwF显著减轻了遗忘。与之前的方法相比,它在VOCCOCO基准测试上分别提高了mAP +2.1%和+2.9%,达到了最先进的性能。

摘要

  • 原文标题:Whole-Body Model-Predictive Control of Legged Robots with MuJoCo
  • 中文标题:基于MuJoCo的腿式机器人全身模型预测控制
  • 发布日期:2025-03-06 16:59:06+00:00
  • 作者:John Z. Zhang, Taylor A. Howell, Zeji Yi, Chaoyi Pan, Guanya Shi, Guannan Qu, Tom Erez, Yuval Tassa, Zachary Manchester
  • 分类:cs.RO, cs.SY, eess.SY
  • 原文链接http://arxiv.org/abs/2503.04613v1

中文摘要:我们展示了一种非常简单的全身模型预测控制MPC)方法在四足机器人双足机器人上的惊人实际效果:使用MuJoCo动力学和有限差分近似导数的迭代LQRiLQR)算法。基于之前在模拟中使用MuJoCo进行基于模型的行为合成以及运动和控制任务的成功经验,我们展示了这些策略可以轻松推广到现实世界,几乎不需要考虑从模拟到现实的转换。我们的基线方法在各种硬件实验中实现了实时全身MPC,包括动态四足运动、四足机器人用两条腿行走以及全尺寸双足人形机器人的运动。我们希望这种易于复现的硬件基线能够降低现实世界全身MPC研究的入门门槛,并为加速社区研究速度做出贡献。我们的代码和实验视频将在线提供:https://johnzhang3.github.io/mujoco_ilqr

摘要

  • 原文标题:TAIL: Text-Audio Incremental Learning
  • 中文标题:TAIL:文本-音频增量学习
  • 发布日期:2025-03-06 09:39:36+00:00
  • 作者:Yingfei Sun, Xu Gu, Wei Ji, Hanbin Zhao, Hao Fei, Yifang Yin, Roger Zimmermann
  • 分类:cs.SD, cs.AI, cs.CV, eess.AS, I.2
  • 原文链接http://arxiv.org/abs/2503.04258v1

中文摘要:许多研究结合文本音频来捕捉多模态信息,但它们忽视了模型在新数据集上的泛化能力。引入新数据集可能会影响原始数据集的特征空间,导致灾难性遗忘。同时,大模型参数会显著影响训练性能。为了解决这些限制,我们引入了一种称为文本-音频增量学习(TAIL)任务的新任务,用于文本-音频检索,并提出了一种新方法PTAT,即用于音频-文本增量学习提示调优。该方法利用提示调优来优化模型参数,同时结合音频-文本相似性特征蒸馏模块,有效缓解灾难性遗忘。我们在AudioCapsClothoBBC Sound EffectsAudioset数据集上对我们的方法和之前的增量学习方法进行了基准测试,我们的方法显著优于之前的方法,特别是在旧数据集上表现出更强的抗遗忘能力。与全参数微调(顺序)方法相比,我们的模型仅需要其参数的2.42%,性能提高了4.46%。

摘要

  • 原文标题:UniNet: A Unified Multi-granular Traffic Modeling Framework for Network Security
  • 中文标题:UniNet:一种统一的网络流量多粒度建模框架
  • 发布日期:2025-03-06 07:39:37+00:00
  • 作者:Binghui Wu, Dinil Mon Divakaran, Mohan Gurusamy
  • 分类:cs.CR, cs.LG, cs.NI
  • 原文链接http://arxiv.org/abs/2503.04174v1

中文摘要:随着现代网络因多样化设备加密协议和不断演变的威胁而变得越来越复杂,网络流量分析变得至关重要。现有的机器学习模型通常仅依赖于数据包的单一表示,限制了其捕捉对稳健分析至关重要的上下文关系的能力。此外,针对监督学习半监督学习无监督学习的任务特定架构导致在适应不同数据格式安全任务时效率低下。为了解决这些问题,我们提出了UniNet,一个统一的框架,引入了一种新颖的多粒度流量表示T-Matrix),集成了会话数据包级别的特征,以提供全面的上下文信息。结合T-Attent,一个轻量级的基于注意力机制的模型,UniNet能够高效地学习适用于多种安全任务的潜在嵌入。通过对四个关键网络安全隐私问题——异常检测攻击分类物联网设备识别加密网站指纹识别——的广泛评估,UniNet在性能上显著优于现有方法,实现了更高的准确性、更低的误报率和更好的可扩展性。通过解决单级模型的局限性并统一流量分析范式,UniNet为现代网络安全设定了新的基准。

摘要

  • 原文标题:Mapping bipartite networks into multidimensional hyperbolic spaces
  • 中文标题:将二分网络映射到多维双曲空间
  • 发布日期:2025-03-06 10:59:26+00:00
  • 作者:Robert Jankowski, Roya Aliakbarisani, M. Ángeles Serrano, Marián Boguñá
  • 分类:physics.soc-ph, cs.SI
  • 原文链接http://arxiv.org/abs/2503.04316v1

中文摘要二分网络出现在许多现实世界的场景中,连接两个不同集合的实体。它们通常通过单模投影进行分析,但这种投影可能会引入人为的相关性和夸大的聚类,掩盖真实的底层结构。在本文中,我们提出了一种二分网络的几何模型,利用高水平的二分四环作为聚类度量,将两种节点类型放置在同一个相似性空间中,其中链接概率随距离减小。此外,我们引入了B-Mercator算法,该算法从二分结构中推断节点位置。我们在多个数据集上评估其性能,展示了生成的嵌入如何改进机器学习中的节点分类和基于距离的链接预测等下游任务。这些双曲嵌入还能够生成节点特征与现实世界非常相似的合成网络,从而在允许安全数据共享的同时保护敏感信息。此外,我们展示了如何通过保留二分结构避免基于投影技术的缺陷,从而获得更准确的描述和更好的性能。我们的方法为揭示复杂二分系统中的隐藏几何提供了一个稳健的框架。

摘要

  • 原文标题:Universality of Layer-Level Entropy-Weighted Quantization Beyond Model Architecture and Size
  • 中文标题:超越模型架构和大小的层级熵加权量化的普适性
  • 发布日期:2025-03-06 18:54:32+00:00
  • 作者:Alireza Behtash, Marijan Fofonjka, Ethan Baird, Tyler Mauer, Hossein Moghimifam, David Stout, Joel Dennison
  • 分类:cs.LG, cs.AI
  • 原文链接http://arxiv.org/abs/2503.04704v1

中文摘要:我们提出了一种新颖的选择性模型量化方法,该方法超越了针对大型语言模型(LLMs)的架构特定和大小依赖的压缩方法的限制,使用熵加权量化(EWQ)。通过分析跨 Transformer 块的熵分布,EWQ确定哪些块可以安全地量化而不会导致显著的性能下降,且独立于模型架构或大小。我们的方法优于均匀量化方法,在保持大规模多任务语言理解(MMLU)准确率得分在未量化模型的0.5%以内的同时,将内存使用量减少了高达18%。我们在多个架构(从1.6B到70B参数)上展示了EWQ的有效性,展示了无论模型规模或架构设计如何,在质量-压缩权衡方面的一致改进。EWQ的一个令人惊讶的发现是,与未量化模型相比,它能够降低困惑度,这表明通过选择性精度降低存在有益的规范化。这一改进在不同模型家族中都成立,表明层级熵与最佳精度要求之间存在基本关系。此外,我们引入了FastEWQ,一种用于熵分布分析的快速方法,无需加载模型权重。该技术利用了跨各种架构和规模的熵分布的普遍特征,能够在保持80%分类准确率的同时,实现近乎即时的量化决策。我们的结果表明,有效的量化策略可以独立于特定的架构选择或模型大小而开发,为高效的LLM部署开辟了新的可能性。

摘要

  • 原文标题:Non-parametric kernel density estimation of magnitude distribution for the analysis of seismic hazard posed by anthropogenic seismicity
  • 中文标题:非参数核密度估计在人为地震活动震级分布分析中的应用
  • 发布日期:2025-03-06 12:43:18+00:00
  • 作者:Francis Tong, Stanisław Lasocki, Beata Orlecka-Sikora
  • 分类:physics.geo-ph, stat.AP
  • 原文链接http://arxiv.org/abs/2503.04393v1

中文摘要:频繁观察到的人为地震震级分布与古登堡-里希特关系的显著偏差,要求采用替代的估计方法进行概率地震危险性评估。我们评估了五种非参数核密度估计(KDE)方法,这些方法应用于从四种震级分布模型中抽取的模拟样本:指数分布凹双指数分布凸双指数分布以及指数-高斯分布。后三种分布代表了由于地壳厚度有限和特征地震效应导致的与古登堡-里希特关系的偏差。假设的与指数分布的偏差从未超过实际中遇到的偏差。研究的KDE方法包括SilvermanScott规则(结合Abramson带宽调整)、两种基于扩散的方法(ISJdiffKDE)以及adaptiveKDE,后者将带宽估计表述为一个优化问题。我们评估了这些方法在震级2到6、样本量400到5000的情况下的表现,使用了100,000次模拟的平均积分平方误差(MISE)。通过样本量为1000的平均重现周期(MRP)说明了它们在危险性评估中的适用性。在测试的方法中,diffKDE为较大震级提供了最准确的累积分布函数估计。即使数据来自指数分布,当样本量至少为1000时,diffKDE的表现与最大似然估计相当。鉴于人为地震通常偏离指数模型,我们建议在样本量足够的情况下,使用diffKDE进行概率地震危险性评估。

摘要

  • 原文标题:Measurement of the Branching Fraction of $Λ_c^+ \to p K_S^0 π^0$ at Belle
  • 中文标题:Belle实验中对$Λ_c^+ \to p K_S^0 π^0$分支比的测量
  • 发布日期:2025-03-06 12:16:01+00:00
  • 作者:The Belle, Belle II Collaborations, :, I. Adachi, L. Aggarwal, H. Ahmed, J. K. Ahn, H. Aihara, N. Akopov, M. Alhakami, A. Aloisio, N. Althubiti, M. Angelsmark, N. Anh Ky, D. M. Asner, H. Atmacan, T. Aushev, V. Aushev, M. Aversano, R. Ayad, V. Babu, H. Bae, N. K. Baghel, S. Bahinipati, P. Bambade, Sw. Banerjee, M. Barrett, M. Bartl, J. Baudot, A. Baur, A. Beaubien, F. Becherer, J. Becker, J. V. Bennett, F. U. Bernlochner, V. Bertacchi, M. Bertemes, E. Bertholet, M. Bessner, S. Bettarini, V. Bhardwaj, B. Bhuyan, F. Bianchi, T. Bilka, D. Biswas, A. Bobrov, D. Bodrov, A. Bolz, A. Bondar, J. Borah, A. Boschetti, A. Bozek, M. Bračko, P. Branchini, R. A. Briere, T. E. Browder, A. Budano, S. Bussino, Q. Campagna, M. Campajola, L. Cao, G. Casarosa, C. Cecchi, J. Cerasoli, M. -C. Chang, P. Chang, P. Cheema, B. G. Cheon, K. Chilikin, K. Chirapatpimol, H. -E. Cho, K. Cho, S. -J. Cho, S. -K. Choi, S. Choudhury, J. Cochran, L. Corona, J. X. Cui, E. De La Cruz-Burelo, S. A. De La Motte, G. De Nardo, G. De Pietro, R. de Sangro, M. Destefanis, S. Dey, R. Dhamija, A. Di Canto, F. Di Capua, J. Dingfelder, Z. Doležal, I. Domínguez Jiménez, T. V. Dong, D. Dossett, S. Dubey, K. Dugic, G. Dujany, P. Ecker, D. Epifanov, J. Eppelt, P. Feichtinger, T. Ferber, T. Fillinger, C. Finck, G. Finocchiaro, F. Forti, A. Frey, B. G. Fulsom, A. Gabrielli, E. Ganiev, M. Garcia-Hernandez, G. Gaudino, V. Gaur, A. Gaz, A. Gellrich, G. Ghevondyan, D. Ghosh, H. Ghumaryan, G. Giakoustidis, R. Giordano, A. Giri, P. Gironella Gironell, A. Glazov, B. Gobbo, R. Godang, O. Gogota, P. Goldenzweig, E. Graziani, D. Greenwald, Z. Gruberová, Y. Guan, K. Gudkova, I. Haide, S. Halder, Y. Han, C. Harris, K. Hayasaka, H. Hayashii, S. Hazra, M. T. Hedges, A. Heidelbach, I. Heredia de la Cruz, M. Hernández Villanueva, T. Higuchi, M. Hoek, M. Hohmann, R. Hoppe, P. Horak, C. -L. Hsu, T. Humair, T. Iijima, K. Inami, N. Ipsita, A. Ishikawa, R. Itoh, M. Iwasaki, P. Jackson, D. Jacobi, W. W. Jacobs, E. -J. Jang, S. Jia, Y. Jin, A. Johnson, K. K. Joo, H. Junkerkalefeld, M. Kaleta, J. Kandra, K. H. Kang, G. Karyan, T. Kawasaki, F. Keil, C. Ketter, C. Kiesling, C. -H. Kim, D. Y. Kim, J. -Y. Kim, K. -H. Kim, Y. -K. Kim, Y. J. Kim, H. Kindo, K. Kinoshita, P. Kodyš, T. Koga, S. Kohani, K. Kojima, A. Korobov, S. Korpar, E. Kovalenko, P. Križan, P. Krokovny, T. Kuhr, Y. Kulii, D. Kumar, M. Kumar, R. Kumar, K. Kumara, T. Kunigo, A. Kuzmin, Y. -J. Kwon, S. Lacaprara, Y. -T. Lai, K. Lalwani, T. Lam, J. S. Lange, T. S. Lau, M. Laurenza, R. Leboucher, F. R. Le Diberder, M. J. Lee, C. Lemettais, P. Leo, C. Li, L. K. Li, Q. M. Li, W. Z. Li, Y. Li, Y. B. Li, Y. P. Liao, J. Libby, J. Lin, S. Lin, M. H. Liu, Q. Y. Liu, Y. Liu, Z. Q. Liu, D. Liventsev, S. Longo, C. Lyu, Y. Ma, C. Madaan, M. Maggiora, S. P. Maharana, R. Maiti, G. Mancinelli, R. Manfredi, E. Manoni, M. Mantovano, D. Marcantonio, S. Marcello, C. Marinas, C. Martellini, A. Martens, A. Martini, T. Martinov, L. Massaccesi, M. Masuda, D. Matvienko, S. K. Maurya, M. Maushart, J. A. McKenna, R. Mehta, F. Meier, D. Meleshko, M. Merola, C. Miller, M. Mirra, S. Mitra, K. Miyabayashi, H. Miyake, R. Mizuk, G. B. Mohanty, S. Mondal, S. Moneta, H. -G. Moser, R. Mussa, I. Nakamura, M. Nakao, H. Nakazawa, Y. Nakazawa, M. Naruki, Z. Natkaniec, A. Natochii, M. Nayak, G. Nazaryan, M. Neu, S. Nishida, S. Ogawa, H. Ono, Y. Onuki, F. Otani, P. Pakhlov, G. Pakhlova, E. Paoloni, S. Pardi, K. Parham, H. Park, J. Park, K. Park, S. -H. Park, B. Paschen, A. Passeri, S. Patra, T. K. Pedlar, I. Peruzzi, R. Peschke, R. Pestotnik, M. Piccolo, L. E. Piilonen, P. L. M. Podesta-Lerma, T. Podobnik, S. Pokharel, C. Praz, S. Prell, E. Prencipe, M. T. Prim, I. Prudiiev, H. Purwar, P. Rados, G. Raeuber, S. Raiz, N. Rauls, K. Ravindran, J. U. Rehman, M. Reif, S. Reiter, M. Remnev, L. Reuter, D. Ricalde Herrmann, I. Ripp-Baudot, G. Rizzo, M. Roehrken, J. M. Roney, A. Rostomyan, N. Rout, D. A. Sanders, S. Sandilya, L. Santelj, Y. Sato, V. Savinov, B. Scavino, J. Schmitz, S. Schneider, G. Schnell, M. Schnepf, K. Schoenning, C. Schwanda, A. J. Schwartz, Y. Seino, A. Selce, K. Senyo, J. Serrano, M. E. Sevior, C. Sfienti, W. Shan, C. Sharma, X. D. Shi, T. Shillington, T. Shimasaki, J. -G. Shiu, D. Shtol, A. Sibidanov, F. Simon, J. B. Singh, J. Skorupa, M. Sobotzik, A. Soffer, A. Sokolov, E. Solovieva, S. Spataro, B. Spruck, W. Song, M. Starič, P. Stavroulakis, S. Stefkova, R. Stroili, J. Strube, Y. Sue, M. Sumihama, K. Sumisawa, W. Sutcliffe, N. Suwonjandee, H. Svidras, M. Takahashi, M. Takizawa, U. Tamponi, K. Tanida, F. Tenchini, A. Thaller, O. Tittel, R. Tiwary, E. Torassa, K. Trabelsi, I. Tsaklidis, M. Uchida, I. Ueda, T. Uglov, K. Unger, Y. Unno, K. Uno, S. Uno, P. Urquijo, Y. Ushiroda, S. E. Vahsen, R. van Tonder, M. Veronesi, A. Vinokurova, V. S. Vismaya, L. Vitale, V. Vobbilisetti, R. Volpe, A. Vossen, M. Wakai, S. Wallner, M. -Z. Wang, X. L. Wang, Z. Wang, A. Warburton, M. Watanabe, S. Watanuki, C. Wessel, E. Won, X. P. Xu, B. D. Yabsley, S. Yamada, W. Yan, S. B. Yang, J. Yelton, J. H. Yin, K. Yoshihara, C. Z. Yuan, J. Yuan, L. Zani, F. Zeng, B. Zhang, V. Zhilich, J. S. Zhou, Q. D. Zhou, L. Zhu, V. I. Zhukova, R. Žlebčík
  • 分类:hep-ex
  • 原文链接http://arxiv.org/abs/2503.04371v1

中文摘要:我们报告了使用Belle实验的980 fb$^{-1}$的$e^+e^-$数据对分支比$\mathcal{B}(\Lambda_c^+\to p K_S^0 \pi^0)/\mathcal{B}(\Lambda_c^+\to p K^- \pi^+)$的精确测量。我们得到的值为$\mathcal{B}(\Lambda_c^+\to p K_S^0 \pi^0)/\mathcal{B}(\Lambda_c^+\to p K^- \pi^+)=0.339\pm 0.002\pm 0.009$,其中第一和第二不确定性分别为统计和系统不确定性。这一Belle结果与之前CLEO实验的测量结果一致,但精度提高了五倍。通过将我们的结果与世界平均$\mathcal{B}(\Lambda_c^+\to p K^- \pi^+)$结合,我们得到了绝对分支比$\mathcal{B}(\Lambda_c^+\to p K_S^0 \pi^0)=(2.12\pm 0.01\pm 0.05 \pm 0.10)\%$,其中不确定性分别为统计、系统以及绝对分支比尺度$\mathcal{B}(\Lambda_c^+\to p K^- \pi^+)$的不确定性。这一测量可以为重子衰变中的强子衰变机制提供新的见解。

摘要

  • 原文标题:Preference for evolving dark energy in light of the galaxy bispectrum
  • 中文标题:基于星系双谱的演化暗能量偏好
  • 发布日期:2025-03-06 16:45:49+00:00
  • 作者:Zhiyu Lu, Théo Simon, Pierre Zhang
  • 分类:astro-ph.CO, gr-qc, hep-ph, hep-th
  • 原文链接http://arxiv.org/abs/2503.04602v1

中文摘要:我们使用由$(w_0, w_a)$参数化的暗能量状态方程$w(z)$分析了DESI之前的聚类数据,发现当与来自Planck宇宙微波背景数据和来自Pantheon+Union3DESY5超新星数据结合时,相较于宇宙常数$\Lambda$,存在$2.8-3.9\sigma$的偏好支持演化的暗能量。我们的约束与DESI Y1结果一致,是基于SDSS/BOSS星系功率谱和双谱,使用大尺度结构有效场论(EFTofLSS)在一环水平上推导的。证据在不同分析变化中保持稳健,但若没有一环双谱则消失。当将DESI重子声学振荡与BOSS全形状数据结合时,同时对后者中的声速视界进行边缘化以防止未考虑的关联,显著性增加到$3.7-4.4\sigma$,具体取决于超新星数据集。使用数据驱动的$w(z)$重建,我们展示了证据来源于多个红移处对$\Lambda$的偏离。此外,我们的发现在暗能量有效场论(EFTofDE)框架内进行了解释,从中我们明确追踪了EFTofLSS预测中的非标准时间演化。对于$w < -1$区域内的微扰稳定理论,当存在高阶导数修正时,证据在聚类极限$(c_s^2 \rightarrow 0)$中持续存在,并且在考虑额外的EFTofDE参数时,在准静态极限$(c_s^2 \rightarrow 1)$中也存在。

摘要

  • 原文标题:Numerical Study On Temperature Variations Of Superheated Steam Flowing Through A Regulation Valve
  • 中文标题:过热蒸汽流经调节阀的温度变化数值研究
  • 发布日期:2025-03-06 08:37:41+00:00
  • 作者:Zhe-hui Ma, Hang-ye Zhang, Chuang Liu, Ming Zhang, Jin-yuan Qian
  • 分类:physics.flu-dyn
  • 原文链接http://arxiv.org/abs/2503.04209v1

中文摘要过热蒸汽广泛应用于各种能源系统中,特别是在发电厂化工行业以及其他需要高温高压蒸汽以实现高效能量转换和过程控制的应用中。在这些系统中,调节阀是控制蒸汽流动、调节其压力和温度以确保安全高效运行的关键组件。准确理解和预测调节阀内的温度变化对于优化其性能和提高整体系统效率至关重要。本研究通过计算流体动力学(CFD)模拟结合本征正交分解(POD)技术,研究了过热蒸汽流经调节阀时的温度变化。分析首先检查了内部流场参数,包括温度和压力,以了解阀门内的整体流体动力学。POD用于降低CFD结果的维度,奇异值分解(SVD)用于提取捕捉传热和温度波动关键流动结构的主导模态。POD分析表明,最具影响力的模态与高湍流强度和显著温度梯度区域相关,这些区域对蒸汽流经调节阀的热性能至关重要。将POD应用于3D CFD结果是一种新颖的方法,特别是对于复杂流体流动模型(如蒸汽流经调节阀)而言。本研究的见解对能源系统中温度和压力调节阀的设计和优化具有实际意义,为提高这些系统的效率和可靠性提供了理论基础。

摘要

  • 原文标题:The JARVIS Infrastructure is All You Need for Materials Design
  • 中文标题:JARVIS 基础设施是材料设计所需的一切
  • 发布日期:2025-03-06 06:26:32+00:00
  • 作者:Kamal Choudhary
  • 分类:cond-mat.mtrl-sci, physics.comp-ph
  • 原文链接http://arxiv.org/abs/2503.04133v1

中文摘要:联合自动化多种集成模拟资源库(JARVIS)是一个综合性的基础设施,提供数据库、工具、教程和基准,用于多尺度、多模态、正向和逆向材料设计。它强调开放获取原则和可重复性,整合了理论和实验方法,如密度泛函理论量子蒙特卡罗紧束缚模型经典力场以及机器学习方法——包括指纹识别图神经网络变压器模型。其实验数据收集涵盖了低温学显微镜衍射,覆盖了金属半导体绝缘体超导体碳捕获系统高强度化合物低维材料异质结构缺陷等材料。JARVIS通过开放数据集、网络应用程序、可执行脚本和同行评审的出版物传播资源,确保广泛的访问性和可重复性。它在全球范围内被广泛采用,促进了数百万数据和工具的下载。通过将多种方法和数据统一在一个平台下,JARVIS推动了基础发现和现实世界的创新,推进了传统和数据驱动的材料设计。

摘要

  • 原文标题:HERACLES++: a multi-dimensional Eulerian code for exascale computing
  • 中文标题:HERACLES++:面向百亿亿次计算的多维欧拉代码
  • 发布日期:2025-03-06 13:37:50+00:00
  • 作者:Lou Roussel-Hard, Edouard Audit, Luc Dessart, Thomas Padioleau, Yushan Wang
  • 分类:astro-ph.SR, astro-ph.GA, astro-ph.HE, astro-ph.IM, physics.comp-ph
  • 原文链接http://arxiv.org/abs/2503.04428v1

中文摘要:多维天体物理流体的数值模拟面临着巨大的挑战。然而,百亿亿次计算的发展显著提升了计算能力,推动了能够充分利用这些资源的新代码的开发。在本文中,我们介绍了HERACLES++,这是一种具有高可移植性的新型流体动力学代码,针对不同架构的百亿亿次计算机进行了优化,能够在CPUGPU上高效运行。该代码采用欧拉方法,并使用Godunov有限体积法来求解流体动力学方程,从而确保在捕捉激波不连续性时的准确性。它包含不同的黎曼求解器状态方程重力求解器。它可以在笛卡尔坐标系球坐标系中工作,支持1维、2维或3维模拟,并使用被动标量来处理多种气体。该代码允许用户提供加热冷却项,以处理各种天体物理场景。除了常规的基准测试系列外,我们还使用HERACLES++模拟了超新星激波在红超巨星包层中的传播,从核心坍缩后的几分钟直到激波出现。在1维情况下,HERACLES++的结果与相同配置下的V1D结果一致。在3维情况下,瑞利-泰勒不稳定性的发展通过引入密度成分波动以及湍流,修改了1维图像。通过聚焦于一个楔形区域而不是整个立体角,以及能够在大量GPU上运行HERACLES++,使得我们能够以亚度分辨率对3维超新星抛射物进行长期模拟。未来的发展目标是将HERACLES++扩展为辐射流体动力学代码。