WikiEdge:ArXiv速递/2025-04-15:修订间差异
Updated page by Carole |
Updated page by Carole |
||
第26行: | 第26行: | ||
*'''原文链接''':http://arxiv.org/abs/2504.11455v1 | *'''原文链接''':http://arxiv.org/abs/2504.11455v1 | ||
'''中文摘要''':摘要:本文提出[[SimpleAR]]框架,这是一种未经复杂架构修改的朴素[[自回归]]视觉生成方法。通过深入探索[[训练]]和[[推理]]优化,我们证明:1) 仅需5亿参数,该模型即可生成1024x1024分辨率的[[高保真图像]],并在[[文本到图像]]基准测试中取得竞争力成绩(如[[GenEval]] 0.59分,[[DPG]] 79.66分);2) [[监督微调]](SFT)和[[组相对策略优化]](GRPO)训练均能显著提升生成美学效果和提示对齐质量;3) 结合[[vLLM]]等推理加速技术,[[SimpleAR]]生成1024x1024图像的时间可缩短至约14秒。通过公开这些发现及开源代码,我们希望揭示[[自回归]]视觉生成的潜力,并鼓励更多研究者参与该领域。代码详见https://github.com/wdrink/SimpleAR。 | '''中文摘要''':摘要:本文提出[[SimpleAR]]框架,这是一种未经复杂架构修改的朴素[[自回归]]视觉生成方法。通过深入探索[[训练]]和[[推理]]优化,我们证明:1) 仅需5亿参数,该模型即可生成1024x1024分辨率的[[高保真图像]],并在[[文本到图像]]基准测试中取得竞争力成绩(如[[GenEval]] 0.59分,[[DPG]] 79.66分);2) [[监督微调]](SFT)和[[组相对策略优化]](GRPO)训练均能显著提升生成美学效果和提示对齐质量;3) 结合[[vLLM]]等推理加速技术,[[SimpleAR]]生成1024x1024图像的时间可缩短至约14秒。通过公开这些发现及开源代码,我们希望揭示[[自回归]]视觉生成的潜力,并鼓励更多研究者参与该领域。代码详见https://github.com/wdrink/SimpleAR。 | ||
== 摘要 == | |||
* '''原文标题''':Smartphone-Based Undergraduate Physics Labs: A Comprehensive Review of Innovation, Accessibility, and Pedagogical Impact | |||
* '''中文标题''':基于智能手机的本科物理实验:创新性、可及性与教学影响的全面综述 | |||
* '''发布日期''':2025-04-15 16:28:13+00:00 | |||
* '''作者''':Yiping Zhao | |||
* '''分类''':physics.ed-ph | |||
*'''原文链接''':http://arxiv.org/abs/2504.11363v1 | |||
'''中文摘要''':基于[[智能手机]]的本科[[物理实验]]:创新性、可及性与教学影响的全面综述 | |||
[[智能手机集成物理实验室]](SmartIPLs)已成为传统[[实验教学]]的可扩展且经济高效的替代方案,为多样化[[学习环境]]提供了便捷的[[实践体验]]。本综述整合了十余年研究成果,涵盖[[力学]]、[[光学]]、[[声学]]、[[电磁学]]、[[热力学]]及[[现代物理]]等关键领域的近200项SmartIPLs案例。SmartIPLs主要分为两类:利用手机内置工具的[[传感器实验]],以及基于[[摄像头]]的[[运动]]与[[光学研究]][[视频]]/[[图像分析]]。[[实证研究]]表明,SmartIPLs在[[概念理解]]、[[科学过程技能]]和[[学生参与度]]方面支持同等或更优的[[教学效果]],特别适用于[[远程教育]]和[[资源匮乏环境]]。本文探讨了其[[理论基础]],与传统及[[虚拟实验室]]进行对比,并解决了[[设备差异性]]和[[课堂整合]]等挑战。未来方向包括:更广泛的[[课程整合]]、[[AI]]驱动的[[学生反馈]]、向[[代表性不足]]的物理主题拓展、[[跨学科应用]]以及注重[[公平性]]的[[教学设计]]。诸如[[佐治亚大学]]智能手机物理实验频道、[[现代光学]][[YouTube]]频道,以及[[SPIE]]出版物《智能手机在光学实验中的应用》等[[开放资源]],体现了[[社区]]推动[[物理教育]][[普及化]]的努力。随着[[智能手机技术]]进步,SmartIPLs将为[[21世纪]][[适应性]]、[[智能化]]和[[包容性]]的[[实验教学]]开辟新路径。 |
2025年4月16日 (三) 14:37的版本
摘要
- 原文标题:Breaking a Long-Standing Barrier: 2-$\varepsilon$ Approximation for Steiner Forest
- 中文标题:突破长期障碍:斯坦纳森林问题的2-ε近似算法
- 发布日期:2025-04-15 17:13:48+00:00
- 作者:Ali Ahmadi, Iman Gholami, MohammadTaghi Hajiaghayi, Peyman Jabbarzade, Mohammad Mahdavi
- 分类:cs.DS
- 原文链接:http://arxiv.org/abs/2504.11398v1
中文摘要:斯坦纳森林问题(又称广义斯坦纳树问题)是边加权图上的一个基本优化问题,其目标是在给定顶点对集合的情况下,选择一个最小成本的子图使得每对顶点都连通。该问题推广了1811年首次提出的斯坦纳树问题,后者的最佳已知近似因子为1.39 Byrka等,2010(STOC 2010最佳论文奖)。Agrawal等,1989(STOC 2023三十年时间检验奖)的开创性工作与Goemans和Williamson,1992(SICOMP'95)的改进,在35年前就建立了斯坦纳森林问题的2-近似算法。Jain(FOCS'98)开创性的迭代舍入技术后来将这些结果扩展到更高连通性场景。尽管该问题具有长期重要性,但突破2的近似因子始终是重大挑战,甚至引发类似顶点覆盖问题的猜想——获得更好因子可能确实困难。值得注意的是,包括Gupta和Kumar(STOC'15)以及[[Gro{\ss}等]](ITCS'18)的基础性工作,分别提出了96和69近似算法,可能寄望为斯坦纳森林问题实现低于2的常数因子近似突破铺路。 本文通过设计一种新颖的确定性算法,实现了$2 - 10^{-11}$的近似比,突破了2的近似壁垒。作为方法的核心组件,我们还针对斯坦纳树问题提出了一种基于对偶的局部搜索算法,其近似保证为$1.943$,该成果本身也具有独立价值。
摘要
- 原文标题:Progressive Rock Music Classification
- 中文标题:渐进摇滚音乐分类
- 发布日期:2025-04-15 02:48:52+00:00
- 作者:Arpan Nagar, Joseph Bensabat, Jokent Gaza, Moinak Dey
- 分类:cs.SD, cs.AI, cs.LG, eess.AS
- 原文链接:http://arxiv.org/abs/2504.10821v1
中文摘要:本研究探讨前卫摇滚音乐的分类问题,该音乐流派以复杂的作曲结构和多样化的器乐编配为特征,与其他音乐风格截然不同。针对这一音乐信息检索(MIR)任务,我们使用Librosa库从歌曲片段中提取了包括声谱图、梅尔频率倒谱系数(MFCCs)、色度图和节拍位置在内的综合音频特征,并通过赢家通吃投票策略将片段级预测聚合为最终歌曲分类。我们对多种机器学习技术进行了对比分析:在计算资源受限情况下,采用主成分分析(PCA)进行降维处理,探索了包含Bagging(随机森林、极端随机树、Bagging分类器)和Boosting(XGBoost、梯度提升)的集成方法;同时研究了深度学习方法,包括开发具有特定层配置、归一化和激活函数的定制一维卷积神经网络(1D CNN)架构(命名为"Zuck"和"Satya"),并微调了基于注意力机制的最先进音频声谱图变换器(AST)模型。验证集和测试集的性能评估显示不同模型效果各异,其中极端随机树等集成方法最高达到76.38%的测试准确率。本研究为前卫摇滚流派分类这一精细任务提供了多种机器学习范式应用及相对性能的深入见解。
摘要
- 原文标题:SimpleAR: Pushing the Frontier of Autoregressive Visual Generation through Pretraining, SFT, and RL
- 中文标题:SimpleAR:通过预训练、监督微调与强化学习推动自回归视觉生成的前沿
- 发布日期:2025-04-15 17:59:46+00:00
- 作者:Junke Wang, Zhi Tian, Xun Wang, Xinyu Zhang, Weilin Huang, Zuxuan Wu, Yu-Gang Jiang
- 分类:cs.CV
- 原文链接:http://arxiv.org/abs/2504.11455v1
中文摘要:摘要:本文提出SimpleAR框架,这是一种未经复杂架构修改的朴素自回归视觉生成方法。通过深入探索训练和推理优化,我们证明:1) 仅需5亿参数,该模型即可生成1024x1024分辨率的高保真图像,并在文本到图像基准测试中取得竞争力成绩(如GenEval 0.59分,DPG 79.66分);2) 监督微调(SFT)和组相对策略优化(GRPO)训练均能显著提升生成美学效果和提示对齐质量;3) 结合vLLM等推理加速技术,SimpleAR生成1024x1024图像的时间可缩短至约14秒。通过公开这些发现及开源代码,我们希望揭示自回归视觉生成的潜力,并鼓励更多研究者参与该领域。代码详见https://github.com/wdrink/SimpleAR。
摘要
- 原文标题:Smartphone-Based Undergraduate Physics Labs: A Comprehensive Review of Innovation, Accessibility, and Pedagogical Impact
- 中文标题:基于智能手机的本科物理实验:创新性、可及性与教学影响的全面综述
- 发布日期:2025-04-15 16:28:13+00:00
- 作者:Yiping Zhao
- 分类:physics.ed-ph
- 原文链接:http://arxiv.org/abs/2504.11363v1
中文摘要:基于智能手机的本科物理实验:创新性、可及性与教学影响的全面综述 智能手机集成物理实验室(SmartIPLs)已成为传统实验教学的可扩展且经济高效的替代方案,为多样化学习环境提供了便捷的实践体验。本综述整合了十余年研究成果,涵盖力学、光学、声学、电磁学、热力学及现代物理等关键领域的近200项SmartIPLs案例。SmartIPLs主要分为两类:利用手机内置工具的传感器实验,以及基于摄像头的运动与光学研究视频/图像分析。实证研究表明,SmartIPLs在概念理解、科学过程技能和学生参与度方面支持同等或更优的教学效果,特别适用于远程教育和资源匮乏环境。本文探讨了其理论基础,与传统及虚拟实验室进行对比,并解决了设备差异性和课堂整合等挑战。未来方向包括:更广泛的课程整合、AI驱动的学生反馈、向代表性不足的物理主题拓展、跨学科应用以及注重公平性的教学设计。诸如佐治亚大学智能手机物理实验频道、现代光学YouTube频道,以及SPIE出版物《智能手机在光学实验中的应用》等开放资源,体现了社区推动物理教育普及化的努力。随着智能手机技术进步,SmartIPLs将为21世纪适应性、智能化和包容性的实验教学开辟新路径。