查看“WikiEdge:ArXiv速递/2025-04-15”的源代码

== 摘要 ==
* '''原文标题'''：Breaking a Long-Standing Barrier: 2-$\varepsilon$ Approximation for Steiner Forest
* '''中文标题'''：突破长期障碍：斯坦纳森林问题的2-ε近似算法
* '''发布日期'''：2025-04-15 17:13:48+00:00
* '''作者'''：Ali Ahmadi, Iman Gholami, MohammadTaghi Hajiaghayi, Peyman Jabbarzade, Mohammad Mahdavi
* '''分类'''：cs.DS
*'''原文链接'''：http://arxiv.org/abs/2504.11398v1
'''中文摘要'''：[[斯坦纳森林问题]]（又称广义[[斯坦纳树问题]]）是边加权图上的一个基本优化问题，其目标是在给定顶点对集合的情况下，选择一个最小成本的子图使得每对顶点都连通。该问题推广了1811年首次提出的[[斯坦纳树问题]]，后者的最佳已知近似因子为1.39 [[Byrka等，2010]]（[[STOC]] 2010最佳论文奖）。[[Agrawal等，1989]]（[[STOC]] 2023三十年时间检验奖）的开创性工作与[[Goemans和Williamson，1992]]（[[SICOMP]]'95）的改进，在35年前就建立了[[斯坦纳森林问题]]的2-近似算法。[[Jain]]（[[FOCS]]'98）开创性的迭代舍入技术后来将这些结果扩展到更高连通性场景。尽管该问题具有长期重要性，但突破2的近似因子始终是重大挑战，甚至引发类似[[顶点覆盖问题]]的猜想——获得更好因子可能确实困难。值得注意的是，包括[[Gupta和Kumar]]（[[STOC]]'15）以及[[Gro{\ss}等]]（[[ITCS]]'18）的基础性工作，分别提出了96和69近似算法，可能寄望为[[斯坦纳森林问题]]实现低于2的常数因子近似突破铺路。
本文通过设计一种新颖的确定性算法，实现了$2 - 10^{-11}$的近似比，突破了2的近似壁垒。作为方法的核心组件，我们还针对[[斯坦纳树问题]]提出了一种基于对偶的局部搜索算法，其近似保证为$1.943$，该成果本身也具有独立价值。

== 摘要 ==
* '''原文标题'''：Progressive Rock Music Classification
* '''中文标题'''：渐进摇滚音乐分类
* '''发布日期'''：2025-04-15 02:48:52+00:00
* '''作者'''：Arpan Nagar, Joseph Bensabat, Jokent Gaza, Moinak Dey
* '''分类'''：cs.SD, cs.AI, cs.LG, eess.AS
*'''原文链接'''：http://arxiv.org/abs/2504.10821v1
'''中文摘要'''：本研究探讨[[前卫摇滚]]音乐的[[分类问题]]，该[[音乐流派]]以复杂的[[作曲结构]]和多样化的[[器乐编配]]为特征，与其他[[音乐风格]]截然不同。针对这一[[音乐信息检索]]（[[MIR]]）任务，我们使用[[Librosa]]库从[[歌曲]]片段中提取了包括[[声谱图]]、[[梅尔频率倒谱系数]]（[[MFCCs]]）、[[色度图]]和[[节拍位置]]在内的综合[[音频特征]]，并通过[[赢家通吃]]投票策略将片段级预测聚合为最终歌曲分类。我们对多种[[机器学习]]技术进行了对比分析：在[[计算资源]]受限情况下，采用[[主成分分析]]（[[PCA]]）进行[[降维]]处理，探索了包含[[Bagging]]（[[随机森林]]、[[极端随机树]]、[[Bagging分类器]]）和[[Boosting]]（[[XGBoost]]、[[梯度提升]]）的[[集成方法]]；同时研究了[[深度学习方法]]，包括开发具有特定[[层配置]]、[[归一化]]和[[激活函数]]的定制[[一维卷积神经网络]]（[[1D CNN]]）架构（命名为"Zuck"和"Satya"），并微调了基于[[注意力机制]]的最先进[[音频声谱图变换器]]（[[AST]]）模型。[[验证集]]和[[测试集]]的[[性能评估]]显示不同[[模型]]效果各异，其中[[极端随机树]]等集成方法最高达到76.38%的测试[[准确率]]。本研究为[[前卫摇滚]]流派分类这一精细任务提供了多种[[机器学习范式]]应用及相对性能的深入见解。

== 摘要 ==
* '''原文标题'''：SimpleAR: Pushing the Frontier of Autoregressive Visual Generation through Pretraining, SFT, and RL
* '''中文标题'''：SimpleAR：通过预训练、监督微调与强化学习推动自回归视觉生成的前沿
* '''发布日期'''：2025-04-15 17:59:46+00:00
* '''作者'''：Junke Wang, Zhi Tian, Xun Wang, Xinyu Zhang, Weilin Huang, Zuxuan Wu, Yu-Gang Jiang
* '''分类'''：cs.CV
*'''原文链接'''：http://arxiv.org/abs/2504.11455v1
'''中文摘要'''：摘要：本文提出[[SimpleAR]]框架，这是一种未经复杂架构修改的朴素[[自回归]]视觉生成方法。通过深入探索[[训练]]和[[推理]]优化，我们证明：1) 仅需5亿参数，该模型即可生成1024x1024分辨率的[[高保真图像]]，并在[[文本到图像]]基准测试中取得竞争力成绩（如[[GenEval]] 0.59分，[[DPG]] 79.66分）；2) [[监督微调]](SFT)和[[组相对策略优化]](GRPO)训练均能显著提升生成美学效果和提示对齐质量；3) 结合[[vLLM]]等推理加速技术，[[SimpleAR]]生成1024x1024图像的时间可缩短至约14秒。通过公开这些发现及开源代码，我们希望揭示[[自回归]]视觉生成的潜力，并鼓励更多研究者参与该领域。代码详见https://github.com/wdrink/SimpleAR。

== 摘要 ==
* '''原文标题'''：Smartphone-Based Undergraduate Physics Labs: A Comprehensive Review of Innovation, Accessibility, and Pedagogical Impact
* '''中文标题'''：基于智能手机的本科物理实验：创新性、可及性与教学影响的全面综述
* '''发布日期'''：2025-04-15 16:28:13+00:00
* '''作者'''：Yiping Zhao
* '''分类'''：physics.ed-ph
*'''原文链接'''：http://arxiv.org/abs/2504.11363v1
'''中文摘要'''：基于[[智能手机]]的本科[[物理实验]]：创新性、可及性与教学影响的全面综述
[[智能手机集成物理实验室]](SmartIPLs)已成为传统[[实验教学]]的可扩展且经济高效的替代方案，为多样化[[学习环境]]提供了便捷的[[实践体验]]。本综述整合了十余年研究成果，涵盖[[力学]]、[[光学]]、[[声学]]、[[电磁学]]、[[热力学]]及[[现代物理]]等关键领域的近200项SmartIPLs案例。SmartIPLs主要分为两类：利用手机内置工具的[[传感器实验]]，以及基于[[摄像头]]的[[运动]]与[[光学研究]][[视频]]/[[图像分析]]。[[实证研究]]表明，SmartIPLs在[[概念理解]]、[[科学过程技能]]和[[学生参与度]]方面支持同等或更优的[[教学效果]]，特别适用于[[远程教育]]和[[资源匮乏环境]]。本文探讨了其[[理论基础]]，与传统及[[虚拟实验室]]进行对比，并解决了[[设备差异性]]和[[课堂整合]]等挑战。未来方向包括：更广泛的[[课程整合]]、[[AI]]驱动的[[学生反馈]]、向[[代表性不足]]的物理主题拓展、[[跨学科应用]]以及注重[[公平性]]的[[教学设计]]。诸如[[佐治亚大学]]智能手机物理实验频道、[[现代光学]][[YouTube]]频道，以及[[SPIE]]出版物《智能手机在光学实验中的应用》等[[开放资源]]，体现了[[社区]]推动[[物理教育]][[普及化]]的努力。随着[[智能手机技术]]进步，SmartIPLs将为[[21世纪]][[适应性]]、[[智能化]]和[[包容性]]的[[实验教学]]开辟新路径。

== 摘要 ==
* '''原文标题'''：What it takes to break a liquid: analysis of the cavitation threshold in various media
* '''中文标题'''：击破液体所需条件：不同介质中空化阈值的分析
* '''发布日期'''：2025-04-15 12:09:58+00:00
* '''作者'''：Gianmaria Viciconte, Paolo Guida, Tadd T. Truscott, William L. Roberts
* '''分类'''：physics.flu-dyn
*'''原文链接'''：http://arxiv.org/abs/2504.11122v1
'''中文摘要'''：[[空化现象]]历来与平衡状态下测量的参数（如[[蒸汽压]]和[[表面张力]]）相关联。然而，当液体处于[[亚稳态]]时也可能发生[[成核]]现象，尤其对于[[高频声波]]诱导空化等快速过程。这正是实验测得的[[空化阈值]]与理论预测存在显著差异的原因之一。
本研究旨在确定具有不同[[物理特性]]的多种物质中的[[成核阈值]]。实验通过24kHz[[超声波]]引发成核，并采用基于[[高速成像]]与[[水听器]]声学测量的创新方法研究[[空化起始]]。两种技术的结合使我们能精确定位液体介质中发生空化的确切时刻。[[气泡成核]]过程以20万帧/秒的速度记录，空间分辨率达微米级。如此精细的[[时空分辨率]]使我们能追踪[[空化气泡]]形成初期的膨胀过程。我们测试了五种不同物质，并通过[[换能器]]振荡幅度重建空化发生时的[[压力场]]，从而确定液体的[[声学空化阈值]]（[[抗拉强度]]）。
实验数据证实：[[蒸汽压]]并非声学系统空化发生的有效指标。更值得注意的是，尽管物质[[物理特性]]各异，所有测试物质均表现出相似行为。这一看似反直觉的现象，为实验室尺度[[声学系统]]中的[[空化成核机制]]提供了新的见解。

== 摘要 ==
* '''原文标题'''：Predicting Wave Dynamics using Deep Learning with Multistep Integration Inspired Attention and Physics-Based Loss Decomposition
* '''中文标题'''：基于多步积分启发注意力与物理损失分解的深度学习波浪动力学预测
* '''发布日期'''：2025-04-15 17:47:20+00:00
* '''作者'''：Indu Kant Deo, Rajeev K. Jaiman
* '''分类'''：cs.LG, cs.NA, math.NA, physics.flu-dyn
*'''原文链接'''：http://arxiv.org/abs/2504.11433v1
'''中文摘要'''：本文提出了一种基于[[物理]]的[[深度学习]]框架，用于[[数据驱动]]的[[流体介质]]中[[波传播]]预测。该框架名为多步积分启发注意力机制（MI2A），通过结合[[降噪卷积自编码器]]（用于[[潜在空间]]降维）与基于[[注意力机制]]的[[LSTM]][[循环神经网络]]（用于降维坐标的[[时间演化]]），从经典[[线性多步方法]]中汲取灵感以增强潜在[[时间积分]]的稳定性和[[长时程精度]]。尽管[[混合神经架构]]在[[波动力学]]建模中具有高效性，但[[自回归预测]]往往容易随时间累积[[相位]]和[[振幅]]误差。为在MI2A框架内缓解此问题，我们提出了一种新型[[损失函数]]分解策略，将[[训练]]损失函数显式分离为相位和振幅两个独立分量。通过三个复杂度递增的基准[[波传播]]问题（[[一维]][[线性对流]]、[[非线性]][[粘性]][[Burgers方程]]和[[二维]][[Saint-Venant]][[浅水系统]]），我们将MI2A与两种采用标准[[均方误差]]损失的[[降阶模型]]（[[序列到序列]][[循环神经网络]]及其[[Luong式注意力]]变体）进行对比。结果表明，MI2A框架显著提升了长期预测的精度和稳定性，能准确保持波的振幅和相位特征。相较于标准LSTM和注意力模型，基于MI2A的深度学习展现出更优的[[泛化能力]]和[[时间精度]]，使其成为[[实时]][[波建模]]的有力工具。

== 摘要 ==
* '''原文标题'''：DataDecide: How to Predict Best Pretraining Data with Small Experiments
* '''中文标题'''：DataDecide：如何通过小规模实验预测最佳预训练数据
* '''发布日期'''：2025-04-15 17:02:15+00:00
* '''作者'''：Ian Magnusson, Nguyen Tai, Ben Bogin, David Heineman, Jena D. Hwang, Luca Soldaini, Akshita Bhagia, Jiacheng Liu, Dirk Groeneveld, Oyvind Tafjord, Noah A. Smith, Pang Wei Koh, Jesse Dodge
* '''分类'''：cs.LG, cs.CL
*'''原文链接'''：http://arxiv.org/abs/2504.11393v1
'''中文摘要'''：由于[[大型语言模型]]在不同[[数据集]]上进行[[预训练]]成本高昂，利用小规模实验来决定[[数据选择]]对降低[[成本]]至关重要。哪些[[基准测试]]方法能从小规模观察到的[[性能]]中最准确地预测出能产生最佳[[大模型]]的数据集？为了开放探索这个问题，我们发布了[[DataDecide]]——包含最全面开放套件的[[模型]]、[[数据]]和[[评估]]，涵盖[[数据差异]]和[[规模变化]]。我们进行了控制性[[预训练]]实验，涉及25个不同来源、[[去重]]和[[过滤]]处理的[[语料库]]（最高达100B[[词元]]），模型规模最高达1B[[参数]]，并采用3个[[随机种子]]。研究发现：单个小规模模型（如1.5亿参数）的[[性能排名]]，对于预测我们更大目标规模（10亿）的最佳模型具有强[[基线]]作用（约80%比较正确）。在8个[[基线方法]]中，没有任何[[缩放定律]]方法能超越单规模预测的[[计算决策边界]]，但[[DataDecide]]可衡量未来[[缩放定律]]的改进。我们还发现：在小规模实验中使用[[连续似然度]]指标作为[[代理]]，可使包括[[MMLU]]、[[ARC]]、[[HellaSwag]]、[[MBPP]]和[[HumanEval]]在内的[[基准测试]]在目标10亿规模下的预测[[准确率]]超过80%，仅需0.01%的[[计算量]]。

== 摘要 ==
* '''原文标题'''：A Navier-Stokes-Peridynamics hybrid algorithm for the coupling of compressible flows and fracturing materials
* '''中文标题'''：可压缩流动与断裂材料耦合的Navier-Stokes-近场动力学混合算法
* '''发布日期'''：2025-04-15 09:25:14+00:00
* '''作者'''：Mingshuo Han, Shiwei Hu, Tianbai Xiao, Yonghao Zhang
* '''分类'''：physics.comp-ph
*'''原文链接'''：http://arxiv.org/abs/2504.11006v1
'''中文摘要'''：摘要：[[流固耦合]]的[[建模]]与[[仿真]]对[[航空航天工程]]的成功至关重要。本研究提出一种新型[[混合算法]]，通过[[介观方法]]模拟[[可压缩流体]]与[[可变形材料]]间的紧密耦合。具体而言，[[高速流动]]采用基于[[分子动理学理论]]构建的稳健[[求解器]]——[[气体动理学格式]]（[[Navier-Stokes]]替代方案）进行描述；材料的[[变形]]、[[损伤]]与[[断裂]]则通过[[键基近场动力学]]（作为[[粗粒度分子动力学]]）实现[[经典连续介质力学]]的[[非局部扩展]]。采用[[虚单元浸没边界法]]实现[[流体]]与[[材料]]的强耦合：每个[[时间步]]内同步更新[[流场]]与[[固体场]]解，并通过[[虚单元]]交换[[物理驱动]]的[[边界条件]]。通过[[预制裂纹板]]中的[[裂纹扩展]]、[[NACA0012翼型]][[亚音速绕流]]、[[圆柱]][[超音速绕流]]及[[冲击波]]作用[[弹性面板]]等大量[[数值实验]]验证算法。仿真结果证明了该[[混合算法]]在求解[[高速流动]]诱发[[断裂扩展]]方面的独特优势。

== 摘要 ==
* '''原文标题'''：Breaking a Long-Standing Barrier: 2-$\varepsilon$ Approximation for Steiner Forest
* '''中文标题'''：打破长期障碍：Steiner森林问题的2-ε近似算法
* '''发布日期'''：2025-04-15 17:13:48+00:00
* '''作者'''：Ali Ahmadi, Iman Gholami, MohammadTaghi Hajiaghayi, Peyman Jabbarzade, Mohammad Mahdavi
* '''分类'''：cs.DS
*'''原文链接'''：http://arxiv.org/abs/2504.11398v1
'''中文摘要'''：[[斯坦纳森林]]问题（又称广义[[斯坦纳树]]问题）是边加权[[图]]上的基础[[优化问题]]：给定若干[[顶点对]]，目标是选择成本最小的[[子图]]使得每对顶点连通。该问题推广了1811年首次提出的[[斯坦纳树问题]]（目前最佳[[逼近因子]]为1.39 [Byrka等，2010，[[STOC]]最佳论文]）。[Agrawal等，1989]（[[STOC 2023]]时间检验奖）与[Goemans和Williamson，1992]的开创性工作确立了2-逼近[[算法]]，该记录已保持35年。[[Jain]]（[[FOCS]]'98）的[[迭代舍入]]技术后来将结果扩展到更高[[连通性]]场景。尽管问题至关重要，突破2的逼近因子始终是重大挑战，甚至引发"是否类似[[顶点覆盖问题]]存在固有难度"的猜想。值得注意的是，[[Gupta和Kumar]]（[[STOC]]'15）与[[Gro{\ss}等]]（[[ITCS]]'18）分别提出96-和69-逼近算法，可能旨在为突破2的常数因子铺路。
本文通过设计新型[[确定性算法]]，实现了$2 - 10^{-11}$的逼近因子，打破了2的障碍。作为关键组件，我们还针对[[斯坦纳树问题]]提出基于[[对偶]]的[[局部搜索算法]]，其$1.943$的逼近保证具有独立价值。

== 摘要 ==
* '''原文标题'''：Progressive Rock Music Classification
* '''中文标题'''：渐进摇滚音乐分类
* '''发布日期'''：2025-04-15 02:48:52+00:00
* '''作者'''：Arpan Nagar, Joseph Bensabat, Jokent Gaza, Moinak Dey
* '''分类'''：cs.SD, cs.AI, cs.LG, eess.AS
*'''原文链接'''：http://arxiv.org/abs/2504.10821v1
'''中文摘要'''：本研究探讨[[前卫摇滚]]音乐的分类问题，该音乐流派以复杂的编曲和多样化的器乐配置为特征，区别于其他音乐风格。针对这一[[音乐信息检索]]（MIR）任务，我们使用[[Librosa]]库从歌曲片段中提取了包括[[声谱图]]、[[梅尔频率倒谱系数]]（MFCCs）、[[色度图]]和[[节拍]]位置在内的综合音频特征，并通过[[赢家通吃]]投票策略将片段级预测聚合为最终歌曲分类。我们对多种[[机器学习]]技术进行了对比分析：在[[集成方法]]方面探索了包含[[Bagging]]（[[随机森林]]、[[极端随机树]]、[[Bagging分类器]]）和[[Boosting]]（[[XGBoost]]、[[梯度提升]]）的算法，并采用[[主成分分析]]（PCA）进行[[降维]]以处理[[高维特征]]集的计算限制；同时研究了[[深度学习方法]]，包括开发具有特定层配置、[[归一化]]和[[激活函数]]的定制[[一维卷积神经网络]]（1D CNN）架构（命名为"Zuck"和"Satya"），并对最先进的[[音频声谱图变换器]]（AST）模型进行[[微调]]，利用其基于[[注意力机制]]的机制进行[[音频分类]]。验证集和测试集的性能评估显示不同模型效果各异，其中[[极端随机树]]等集成方法最高达到76.38%的测试准确率。本研究为[[前卫摇滚]]流派分类这一精细任务提供了多种[[机器学习范式]]应用及相对性能的深入见解。