WikiEdge:ArXiv速递/2025-03-05

来自WikiEdge
Carole留言 | 贡献2025年3月6日 (四) 23:46的版本 (Updated page by Carole)
跳转到导航 跳转到搜索

摘要

  • 原文标题:First Limits on Light Dark Matter Interactions in a Low Threshold Two Channel Athermal Phonon Detector from the TESSERACT Collaboration
  • 中文标题:TESSERACT合作组在低阈值双通道非热声子探测器中首次对轻暗物质相互作用的限制
  • 发布日期:2025-03-05 17:22:53+00:00
  • 作者:C. L. Chang, Y. -Y. Chang, L. Chaplinsky, C. W. Fink, M. Garcia-Sciveres, W. Guo, S. A. Hertel, X. Li, J. Lin, M. Lisovenko, R. Mahapatra, W. Matava, D. N. McKinsey, V. Novati, P. K. Patel, B. Penning, H. D. Pinckney, M. Platt, M. Pyle, Y. Qi, M. Reed, G. R. C Rischbieter, R. K. Romani, B. Sadoulet, B. Serfass, P. Sorensen, A. Suzuki, V. Velan, G. Wang, Y. Wang, S. L. Watkins, M. R. Williams, J. K. Wuko, T. Aramaki, P. Cushman, N. N. Gite, A. Gupta, M. E. Huber, N. A. Kurinsky, J. S. Mammo, A. J. Mayer, J. Nelson, S. M. Oser, L. Pandey, A. Pradeep, W. Rau, T. Saab
  • 分类:hep-ex, physics.ins-det
  • 原文链接http://arxiv.org/abs/2503.03683v1

中文摘要:我们展示了在地面运行的1 cm² × 1 mm厚(0.233克)高分辨率非热声子探测器中,对自旋无关的暗物质-核子相互作用的搜索结果。该传感器实现了σ_P = 361.5(4)毫电子伏特的能量分辨率,这是迄今为止任何非热声子探测器的最佳分辨率。通过0.233克 × 12小时的曝光量,我们对44至87兆电子伏特/平方c之间的暗物质质量设定了最严格的限制,最低未探索的截面为4e-32平方厘米,对应87兆电子伏特/平方c。我们采用了一种保守的盐化技术,达到了迄今为止通过直接探测实验探测到的最低暗物质质量。这一限制是通过双通道抑制与单个传感器耦合的低能背景实现的。

摘要

  • 原文标题:Towards Understanding Distilled Reasoning Models: A Representational Approach
  • 中文标题:理解蒸馏推理模型:一种表征方法
  • 发布日期:2025-03-05 18:40:19+00:00
  • 作者:David D. Baek, Max Tegmark
  • 分类:cs.LG
  • 原文链接http://arxiv.org/abs/2503.03730v1

中文摘要:在本文中,我们研究了模型蒸馏如何影响大型语言模型(LLMs)中推理特征的发展。为了探索这一点,我们在Qwen系列模型及其微调变体上训练了一个跨编码器。我们的结果表明,跨编码器学习了与各种推理类型相对应的特征,包括自我反思计算验证。此外,我们观察到蒸馏模型包含独特的推理特征方向,这些方向可用于引导模型进入过度思考敏锐思考模式。特别是,我们对四种特定的推理类别进行了分析:(a)自我反思,(b)演绎推理,(c)替代推理,以及(d)对比推理。最后,我们研究了蒸馏过程导致的特征几何变化,并发现较大的蒸馏模型可能会发展出更具结构化的表示,这与增强的蒸馏性能相关。通过提供关于蒸馏如何修改模型的见解,我们的研究有助于提高AI系统透明度可靠性

摘要

  • 原文标题:Active 6D Pose Estimation for Textureless Objects using Multi-View RGB Frames
  • 中文标题:使用多视角RGB帧进行无纹理物体的主动6D姿态估计
  • 发布日期:2025-03-05 18:28:32+00:00
  • 作者:Jun Yang, Wenjie Xue, Sahar Ghavidel, Steven L. Waslander
  • 分类:cs.CV, cs.RO
  • 原文链接http://arxiv.org/abs/2503.03726v1

中文摘要:从RGB图像中估计无纹理物体的6D姿态机器人学中的一个重要问题。由于外观模糊性、旋转对称性和严重遮挡,基于单视图的6D姿态估计器仍然无法处理广泛的物体,这促使了多视图姿态估计最佳视角预测的研究,以解决这些限制。在这项工作中,我们提出了一个全面的主动感知框架,仅使用RGB图像来估计无纹理物体的6D姿态。我们的方法基于一个关键思想:将6D姿态估计解耦为一个顺序的两步过程可以显著提高准确性和效率。首先,我们估计每个物体的3D平移,解决RGB图像固有的尺度和深度模糊性。然后,这些估计用于简化后续的3D方向确定任务,我们通过规范尺度模板匹配来实现。基于这一公式,我们进一步引入了一种主动感知策略,预测下一个最佳相机视角以捕捉RGB图像,有效减少物体姿态的不确定性并提高姿态准确性。我们在公开的ROBI数据集以及我们自己创建的透明物体数据集上评估了我们的方法。在使用相同相机视角进行评估时,我们的多视图姿态估计显著优于最先进的方法。此外,通过利用我们的最佳视角策略,我们的方法在比基于启发式策略更少的视角下实现了高物体姿态准确性。

摘要

  • 原文标题:Exploring Dual-Iron Atomic Catalysts for Efficient Nitrogen Reduction: A Comprehensive Study on Structural and Electronic Optimization
  • 中文标题:探索双铁原子催化剂用于高效氮还原:结构与电子优化的综合研究
  • 发布日期:2025-03-05 12:00:44+00:00
  • 作者:Zhe Zhang, Wenxin Ma, Jiajie Qiao, Xiaoliang Wu, Shaowen Yu, Weiye Hou, Xiang Huang, Rubin Huo, Hongbo Wu, Yusong Tu
  • 分类:cond-mat.mtrl-sci, physics.chem-ph
  • 原文链接http://arxiv.org/abs/2503.03427v1

中文摘要氮还原反应(NRR)作为一种高效且绿色的氨合成途径,在实现按需氨生产中起着至关重要的作用。本研究提出了一种基于双铁原子位点和氮硼共掺杂石墨烯催化剂的新设计理念,探索其在NRR中的高效性。通过调节N和B的共掺杂比例,我们发现Fe2N3B@G催化剂在N2分子的吸附和氢化中表现出显著的活性,尤其是在NRR远端路径上具有最低的自由能(0.32 eV),显示出其优异的氮活化能力和NRR性能。计算的电子局域化函数晶体轨道哈密顿布居静电势图揭示了Fe2N3B@G催化剂改进的NRR动力学源于N3B共掺杂诱导的Fe-Fe电子环境优化、Fe-N键强度的调节以及N2断裂和氢化过程中的持续电子支持。特别是,机器学习分子动力学(MLMD)模拟被用来验证Fe2N3B@G催化剂在NRR中的高活性,结果表明Fe2N3B@G有效调节了Fe-N键的电子密度,确保了NH3分子的顺利生成和解吸,并避免了与析氢反应(HER)的竞争。此外,Fe2N3B@G催化剂确定的较高HER过电位可以有效抑制HER并增强对NRR的选择性。此外,Fe2N3B@G催化剂在高达500 K的分子动力学模拟中也表现出良好的热稳定性,为其在实际应用中的可行性提供了支持。本研究展示了Fe2N3B@G在氮还原催化中的优越性能,并通过共掺杂策略和深入的电子环境调节为原子催化剂设计提供了理论指导。

摘要

  • 原文标题:A Multimodal Framework for Topic Propagation Classification in Social Networks
  • 中文标题:社交网络中话题传播分类的多模态框架
  • 发布日期:2025-03-05 02:12:23+00:00
  • 作者:Yuchuan Jiang, Chaolong Jia, Yunyi Qin, Wei Cai, Yongsen Qian
  • 分类:cs.SI, cs.AI, cs.NE
  • 原文链接http://arxiv.org/abs/2503.03112v1

中文摘要互联网的快速发展和社交网络的广泛采用显著加速了信息传播。然而,这种转变也带来了信息捕获信息处理的复杂性,给研究人员和实践者带来了巨大挑战。因此,预测社交网络中与主题相关的信息传播已成为一个关键的研究焦点。本文通过整合从关键传播特征中提取的多维特征,提出了一种用于社交网络中主题传播的预测模型。具体而言,我们在PageRank算法中引入了两个新指标——用户关系广度用户权威性,以更有效地量化用户影响力。此外,我们采用Text-CNN模型进行情感分类,从文本内容中提取情感特征。节点的时序嵌入通过Bi-LSTM模型进行编码,以捕捉时序动态。此外,我们改进了用户与主题交互痕迹的测量方法,用更精确的传播特征度量替代了传统的主题浏览量指标。最后,我们使用Transformer模型整合提取的多维特征,显著提升了预测性能。实验结果表明,我们提出的模型在FI-ScoreAUCRecall方面优于传统的机器学习单模态深度学习模型,验证了其在预测社交网络中主题传播方面的有效性。

摘要

  • 原文标题:Improving LLM Safety Alignment with Dual-Objective Optimization
  • 中文标题:通过双目标优化改进大语言模型的安全对齐
  • 发布日期:2025-03-05 18:01:05+00:00
  • 作者:Xuandong Zhao, Will Cai, Tianneng Shi, David Huang, Licong Lin, Song Mei, Dawn Song
  • 分类:cs.CL, cs.CR, cs.LG
  • 原文链接http://arxiv.org/abs/2503.03710v1

中文摘要:现有的大型语言模型(LLMs)训练时安全对齐技术在面对越狱攻击时仍然脆弱。直接偏好优化DPO)作为一种广泛部署的对齐方法,在实验和理论背景下都表现出局限性,因为其损失函数在拒绝学习方面被证明是次优的。通过基于梯度的分析,我们识别了这些不足,并提出了一种改进的安全对齐方法,将DPO目标分解为两个部分:(1)鲁棒的拒绝训练,即使在生成部分不安全内容时也鼓励拒绝;(2)有针对性地遗忘有害知识。这种方法显著提高了LLM在面对各种越狱攻击时的鲁棒性,包括预填充后缀多轮攻击,涵盖分布内分布外场景。此外,我们引入了一种方法,通过结合基于奖励的令牌级加权机制来强调关键的拒绝令牌,从而进一步提高对抗性攻击的鲁棒性。我们的研究还表明,对越狱攻击的鲁棒性与训练过程中令牌分布的偏移以及拒绝和有害令牌的内部表示相关,为未来LLM安全对齐研究提供了有价值的方向。代码可在https://github.com/wicai24/DOOR-Alignment获取。

摘要

  • 原文标题:Fast and Precise Spectral Analysis for Dark Matter Searches with LIGO
  • 中文标题:快速精确的频谱分析用于LIGO暗物质搜索
  • 发布日期:2025-03-05 09:18:14+00:00
  • 作者:Alexandre Göttel, Vivien Raymond
  • 分类:astro-ph.CO, gr-qc
  • 原文链接http://arxiv.org/abs/2503.03293v1

中文摘要:我们引入了一种新颖的对数谱估计方法,用于利用引力波探测器进行暗物质搜索,将已建立的暗物质搜索技术计算机音乐分析的见解相结合。通过利用时域频域之间的对称性,该方法在计算效率上与基于FFT的算法相当,但不像这些算法那样牺牲精度。我们将这种方法应用于LIGO第三次观测运行的数据,直接将其性能与之前的搜索进行比较。我们的结果显示,在几乎整个频率范围内,性能一致提高了15%,且无需额外的计算成本。随着进一步改进的潜力,该方法已经提供了一种能够最大化当前和未来引力波观测站科学潜力的解决方案。

摘要

  • 原文标题:Nanocavity-Enhanced Second-Harmonic Generation from Colossal Quantum Dots
  • 中文标题:纳米腔增强的巨量子点二次谐波产生
  • 发布日期:2025-03-05 00:22:01+00:00
  • 作者:David Sharp, Abhinav Kala, Hannah Rarick, Hao A. Nguyen, Elise Skytte, Brandi M. Cossairt, Arka Majumdar
  • 分类:physics.optics, physics.app-ph
  • 原文链接http://arxiv.org/abs/2503.03072v1

中文摘要胶体量子点(QDs)是非线性光学和与光子器件确定性异质集成的有吸引力的介质。通过将量子点耦合到低模体积的光子纳米腔中,可以进一步增强其固有的非线性特性,从而实现低功耗的片上非线性光学。在本文中,我们通过将巨型量子点氮化硅纳米束腔集成,展示了腔增强的二次谐波产生。通过使用超快脉冲激光泵浦腔-量子点系统,我们观察到腔耦合量子点产生了强烈的二次谐波,并估计增强因子约为3,040。我们的工作,结合之前报道的巨型量子点的确定性定位,可以为低功耗非线性光学提供一个可扩展的量子点-腔平台。

摘要

  • 原文标题:Sublinear Data Structures for Nearest Neighbor in Ultra High Dimensions
  • 中文标题:超维空间中最近邻的次线性数据结构
  • 发布日期:2025-03-05 00:37:39+00:00
  • 作者:Martin G. Herold, Danupon Nanongkai, Joachim Spoerhase, Nithin Varma, Zihang Wu
  • 分类:cs.DS, cs.CG
  • 原文链接http://arxiv.org/abs/2503.03079v1

中文摘要几何数据结构在维度远小于输入点数量的情况下得到了广泛研究。然而,在机器学习的许多场景中,维度可能远高于点的数量,甚至高到数据结构无法读取和存储输入点和查询点的所有坐标。受这些场景以及特征选择可解释聚类相关研究的启发,我们开始研究这种超高维情况下的几何数据结构。我们的重点是**近似最近邻**问题。在该问题中,给定一组$n$个点$C\subseteq \mathbb{R}^d$,需要生成一个**小型**数据结构,能够**快速**回答以下查询:给定$q\in \mathbb{R}^d$,返回一个近似最近的点$c\in C$。本文的主要问题是:**当$d\gg n$时,是否存在具有次线性($o(nd)$)空间和次线性($o(d)$)查询时间的数据结构?** 在本文中,我们肯定地回答了这个问题。我们提出了$(1+\epsilon)$-近似数据结构,并给出了以下保证。对于$\ell_1$-和$\ell_2$-范数距离:$\tilde O(n \log(d)/\mathrm{poly}(\epsilon))$空间和$\tilde O(n/\mathrm{poly}(\epsilon))$查询时间。我们证明了这些空间和时间界限在$\mathrm{poly}{(\log n/\epsilon)}$因子内是紧的。对于$\ell_p$-范数距离:$\tilde O(n^2 \log(d) (\log\log (n)/\epsilon)^p)$空间和$\tilde O\left(n(\log\log (n)/\epsilon)^p\right)$查询时间。通过简单的归约,我们的数据结构暗示了其他一些几何问题的次线性-$d$数据结构;例如,近似正交范围搜索最远邻,并产生了$k$-中位数和$k$-均值聚类的次线性$O(1)$-近似表示。