WikiEdge:ArXiv速递/2025-03-05：修订间差异

2025年3月6日 (四) 23:42的版本

摘要

原文标题：First Limits on Light Dark Matter Interactions in a Low Threshold Two Channel Athermal Phonon Detector from the TESSERACT Collaboration
中文标题：TESSERACT合作组在低阈值双通道非热声子探测器中首次对轻暗物质相互作用的限制
发布日期：2025-03-05 17:22:53+00:00
作者：C. L. Chang, Y. -Y. Chang, L. Chaplinsky, C. W. Fink, M. Garcia-Sciveres, W. Guo, S. A. Hertel, X. Li, J. Lin, M. Lisovenko, R. Mahapatra, W. Matava, D. N. McKinsey, V. Novati, P. K. Patel, B. Penning, H. D. Pinckney, M. Platt, M. Pyle, Y. Qi, M. Reed, G. R. C Rischbieter, R. K. Romani, B. Sadoulet, B. Serfass, P. Sorensen, A. Suzuki, V. Velan, G. Wang, Y. Wang, S. L. Watkins, M. R. Williams, J. K. Wuko, T. Aramaki, P. Cushman, N. N. Gite, A. Gupta, M. E. Huber, N. A. Kurinsky, J. S. Mammo, A. J. Mayer, J. Nelson, S. M. Oser, L. Pandey, A. Pradeep, W. Rau, T. Saab
分类：hep-ex, physics.ins-det
原文链接：http://arxiv.org/abs/2503.03683v1

中文摘要：我们展示了在地面运行的1 cm² × 1 mm厚（0.233克）高分辨率硅非热声子探测器中，对自旋无关的暗物质-核子相互作用的搜索结果。该传感器实现了σ_P = 361.5(4)毫电子伏特的能量分辨率，这是迄今为止任何非热声子探测器的最佳分辨率。通过0.233克 × 12小时的曝光量，我们对44至87兆电子伏特/平方c之间的暗物质质量设定了最严格的限制，最低未探索的截面为4e-32平方厘米，对应87兆电子伏特/平方c。我们采用了一种保守的盐化技术，达到了迄今为止通过直接探测实验探测到的最低暗物质质量。这一限制是通过双通道抑制与单个传感器耦合的低能背景实现的。

摘要

原文标题：Towards Understanding Distilled Reasoning Models: A Representational Approach
中文标题：理解蒸馏推理模型：一种表征方法
发布日期：2025-03-05 18:40:19+00:00
作者：David D. Baek, Max Tegmark
分类：cs.LG
原文链接：http://arxiv.org/abs/2503.03730v1

中文摘要：在本文中，我们研究了模型蒸馏如何影响大型语言模型（LLMs）中推理特征的发展。为了探索这一点，我们在Qwen系列模型及其微调变体上训练了一个跨编码器。我们的结果表明，跨编码器学习了与各种推理类型相对应的特征，包括自我反思和计算验证。此外，我们观察到蒸馏模型包含独特的推理特征方向，这些方向可用于引导模型进入过度思考或敏锐思考模式。特别是，我们对四种特定的推理类别进行了分析：（a）自我反思，（b）演绎推理，（c）替代推理，以及（d）对比推理。最后，我们研究了蒸馏过程导致的特征几何变化，并发现较大的蒸馏模型可能会发展出更具结构化的表示，这与增强的蒸馏性能相关。通过提供关于蒸馏如何修改模型的见解，我们的研究有助于提高AI系统的透明度和可靠性。

摘要

原文标题：Active 6D Pose Estimation for Textureless Objects using Multi-View RGB Frames
中文标题：使用多视角RGB帧进行无纹理物体的主动6D姿态估计
发布日期：2025-03-05 18:28:32+00:00
作者：Jun Yang, Wenjie Xue, Sahar Ghavidel, Steven L. Waslander
分类：cs.CV, cs.RO
原文链接：http://arxiv.org/abs/2503.03726v1

中文摘要：从RGB图像中估计无纹理物体的6D姿态是机器人学中的一个重要问题。由于外观模糊性、旋转对称性和严重遮挡，基于单视图的6D姿态估计器仍然无法处理广泛的物体，这促使了多视图姿态估计和最佳视角预测的研究，以解决这些限制。在这项工作中，我们提出了一个全面的主动感知框架，仅使用RGB图像来估计无纹理物体的6D姿态。我们的方法基于一个关键思想：将6D姿态估计解耦为一个顺序的两步过程可以显著提高准确性和效率。首先，我们估计每个物体的3D平移，解决RGB图像固有的尺度和深度模糊性。然后，这些估计用于简化后续的3D方向确定任务，我们通过规范尺度模板匹配来实现。基于这一公式，我们进一步引入了一种主动感知策略，预测下一个最佳相机视角以捕捉RGB图像，有效减少物体姿态的不确定性并提高姿态准确性。我们在公开的ROBI数据集以及我们自己创建的透明物体数据集上评估了我们的方法。在使用相同相机视角进行评估时，我们的多视图姿态估计显著优于最先进的方法。此外，通过利用我们的最佳视角策略，我们的方法在比基于启发式策略更少的视角下实现了高物体姿态准确性。

摘要

原文标题：Exploring Dual-Iron Atomic Catalysts for Efficient Nitrogen Reduction: A Comprehensive Study on Structural and Electronic Optimization
中文标题：探索双铁原子催化剂用于高效氮还原：结构与电子优化的综合研究
发布日期：2025-03-05 12:00:44+00:00
作者：Zhe Zhang, Wenxin Ma, Jiajie Qiao, Xiaoliang Wu, Shaowen Yu, Weiye Hou, Xiang Huang, Rubin Huo, Hongbo Wu, Yusong Tu
分类：cond-mat.mtrl-sci, physics.chem-ph
原文链接：http://arxiv.org/abs/2503.03427v1

中文摘要：氮还原反应（NRR）作为一种高效且绿色的氨合成途径，在实现按需氨生产中起着至关重要的作用。本研究提出了一种基于双铁原子位点和氮硼共掺杂石墨烯催化剂的新设计理念，探索其在NRR中的高效性。通过调节N和B的共掺杂比例，我们发现Fe2N3B@G催化剂在N2分子的吸附和氢化中表现出显著的活性，尤其是在NRR远端路径上具有最低的自由能（0.32 eV），显示出其优异的氮活化能力和NRR性能。计算的电子局域化函数、晶体轨道哈密顿布居、静电势图揭示了Fe2N3B@G催化剂改进的NRR动力学源于N3B共掺杂诱导的Fe-Fe电子环境优化、Fe-N键强度的调节以及N2断裂和氢化过程中的持续电子支持。特别是，机器学习分子动力学（MLMD）模拟被用来验证Fe2N3B@G催化剂在NRR中的高活性，结果表明Fe2N3B@G有效调节了Fe-N键的电子密度，确保了NH3分子的顺利生成和解吸，并避免了与析氢反应（HER）的竞争。此外，Fe2N3B@G催化剂确定的较高HER过电位可以有效抑制HER并增强对NRR的选择性。此外，Fe2N3B@G催化剂在高达500 K的分子动力学模拟中也表现出良好的热稳定性，为其在实际应用中的可行性提供了支持。本研究展示了Fe2N3B@G在氮还原催化中的优越性能，并通过共掺杂策略和深入的电子环境调节为原子催化剂设计提供了理论指导。

摘要

原文标题：A Multimodal Framework for Topic Propagation Classification in Social Networks
中文标题：社交网络中话题传播分类的多模态框架
发布日期：2025-03-05 02:12:23+00:00
作者：Yuchuan Jiang, Chaolong Jia, Yunyi Qin, Wei Cai, Yongsen Qian
分类：cs.SI, cs.AI, cs.NE
原文链接：http://arxiv.org/abs/2503.03112v1

中文摘要：互联网的快速发展和社交网络的广泛采用显著加速了信息传播。然而，这种转变也带来了信息捕获和信息处理的复杂性，给研究人员和实践者带来了巨大挑战。因此，预测社交网络中与主题相关的信息传播已成为一个关键的研究焦点。本文通过整合从关键传播特征中提取的多维特征，提出了一种用于社交网络中主题传播的预测模型。具体而言，我们在PageRank算法中引入了两个新指标——用户关系广度和用户权威性，以更有效地量化用户影响力。此外，我们采用Text-CNN模型进行情感分类，从文本内容中提取情感特征。节点的时序嵌入通过Bi-LSTM模型进行编码，以捕捉时序动态。此外，我们改进了用户与主题交互痕迹的测量方法，用更精确的传播特征度量替代了传统的主题浏览量指标。最后，我们使用Transformer模型整合提取的多维特征，显著提升了预测性能。实验结果表明，我们提出的模型在FI-Score、AUC和Recall方面优于传统的机器学习和单模态深度学习模型，验证了其在预测社交网络中主题传播方面的有效性。

摘要

原文标题：Improving LLM Safety Alignment with Dual-Objective Optimization
中文标题：通过双目标优化改进大语言模型的安全对齐
发布日期：2025-03-05 18:01:05+00:00
作者：Xuandong Zhao, Will Cai, Tianneng Shi, David Huang, Licong Lin, Song Mei, Dawn Song
分类：cs.CL, cs.CR, cs.LG
原文链接：http://arxiv.org/abs/2503.03710v1

中文摘要：现有的大型语言模型（LLMs）训练时安全对齐技术在面对越狱攻击时仍然脆弱。直接偏好优化（DPO）作为一种广泛部署的对齐方法，在实验和理论背景下都表现出局限性，因为其损失函数在拒绝学习方面被证明是次优的。通过基于梯度的分析，我们识别了这些不足，并提出了一种改进的安全对齐方法，将DPO目标分解为两个部分：（1）鲁棒的拒绝训练，即使在生成部分不安全内容时也鼓励拒绝；（2）有针对性地遗忘有害知识。这种方法显著提高了LLM在面对各种越狱攻击时的鲁棒性，包括预填充、后缀和多轮攻击，涵盖分布内和分布外场景。此外，我们引入了一种方法，通过结合基于奖励的令牌级加权机制来强调关键的拒绝令牌，从而进一步提高对抗性攻击的鲁棒性。我们的研究还表明，对越狱攻击的鲁棒性与训练过程中令牌分布的偏移以及拒绝和有害令牌的内部表示相关，为未来LLM安全对齐研究提供了有价值的方向。代码可在https://github.com/wicai24/DOOR-Alignment获取。

@@ 第43行： / 第43行： @@
 *'''原文链接'''：http://arxiv.org/abs/2503.03112v1
 '''中文摘要'''：[[互联网]]的快速发展和[[社交网络]]的广泛采用显著加速了[[信息传播]]。然而，这种转变也带来了[[信息捕获]]和[[信息处理]]的复杂性，给研究人员和实践者带来了巨大挑战。因此，预测社交网络中与主题相关的信息传播已成为一个关键的研究焦点。本文通过整合从关键传播特征中提取的多维特征，提出了一种用于社交网络中主题传播的预测模型。具体而言，我们在[[PageRank算法]]中引入了两个新指标——[[用户关系广度]]和[[用户权威性]]，以更有效地量化[[用户影响力]]。此外，我们采用[[Text-CNN模型]]进行[[情感分类]]，从文本内容中提取[[情感特征]]。节点的时序嵌入通过[[Bi-LSTM模型]]进行编码，以捕捉时序动态。此外，我们改进了用户与主题交互痕迹的测量方法，用更精确的传播特征度量替代了传统的[[主题浏览量]]指标。最后，我们使用[[Transformer模型]]整合提取的多维特征，显著提升了预测性能。实验结果表明，我们提出的模型在[[FI-Score]]、[[AUC]]和[[Recall]]方面优于传统的[[机器学习]]和[[单模态深度学习]]模型，验证了其在预测社交网络中主题传播方面的有效性。
+== 摘要 ==
+* '''原文标题'''：Improving LLM Safety Alignment with Dual-Objective Optimization
+* '''中文标题'''：通过双目标优化改进大语言模型的安全对齐
+* '''发布日期'''：2025-03-05 18:01:05+00:00
+* '''作者'''：Xuandong Zhao, Will Cai, Tianneng Shi, David Huang, Licong Lin, Song Mei, Dawn Song
+* '''分类'''：cs.CL, cs.CR, cs.LG
+*'''原文链接'''：http://arxiv.org/abs/2503.03710v1
+'''中文摘要'''：现有的大型语言模型（[[LLMs]]）训练时安全对齐技术在面对[[越狱攻击]]时仍然脆弱。[[直接偏好优化]]（[[DPO]]）作为一种广泛部署的对齐方法，在实验和理论背景下都表现出局限性，因为其损失函数在[[拒绝学习]]方面被证明是次优的。通过基于梯度的分析，我们识别了这些不足，并提出了一种改进的安全对齐方法，将[[DPO]]目标分解为两个部分：（1）鲁棒的拒绝训练，即使在生成部分不安全内容时也鼓励拒绝；（2）有针对性地遗忘有害知识。这种方法显著提高了[[LLM]]在面对各种[[越狱攻击]]时的鲁棒性，包括[[预填充]]、[[后缀]]和[[多轮攻击]]，涵盖[[分布内]]和[[分布外]]场景。此外，我们引入了一种方法，通过结合基于奖励的令牌级加权机制来强调关键的拒绝令牌，从而进一步提高对抗性攻击的鲁棒性。我们的研究还表明，对[[越狱攻击]]的鲁棒性与训练过程中令牌分布的偏移以及拒绝和有害令牌的内部表示相关，为未来[[LLM]]安全对齐研究提供了有价值的方向。代码可在https://github.com/wicai24/DOOR-Alignment获取。

WikiEdge:ArXiv速递/2025-03-05：修订间差异

2025年3月6日 (四) 23:42的版本

目录

摘要

摘要

摘要

摘要

摘要

摘要

导航菜单