WikiEdge:ArXiv速遞/2025-03-05

出自WikiEdge
於 2025年3月6日 (四) 23:47 由 Carole對話 | 貢獻 所做的修訂 (Updated page by Carole)
跳至導覽 跳至搜尋

摘要

  • 原文標題:First Limits on Light Dark Matter Interactions in a Low Threshold Two Channel Athermal Phonon Detector from the TESSERACT Collaboration
  • 中文標題:TESSERACT合作組在低閾值雙通道非熱聲子探測器中首次對輕暗物質相互作用的限制
  • 發佈日期:2025-03-05 17:22:53+00:00
  • 作者:C. L. Chang, Y. -Y. Chang, L. Chaplinsky, C. W. Fink, M. Garcia-Sciveres, W. Guo, S. A. Hertel, X. Li, J. Lin, M. Lisovenko, R. Mahapatra, W. Matava, D. N. McKinsey, V. Novati, P. K. Patel, B. Penning, H. D. Pinckney, M. Platt, M. Pyle, Y. Qi, M. Reed, G. R. C Rischbieter, R. K. Romani, B. Sadoulet, B. Serfass, P. Sorensen, A. Suzuki, V. Velan, G. Wang, Y. Wang, S. L. Watkins, M. R. Williams, J. K. Wuko, T. Aramaki, P. Cushman, N. N. Gite, A. Gupta, M. E. Huber, N. A. Kurinsky, J. S. Mammo, A. J. Mayer, J. Nelson, S. M. Oser, L. Pandey, A. Pradeep, W. Rau, T. Saab
  • 分類:hep-ex, physics.ins-det
  • 原文連結http://arxiv.org/abs/2503.03683v1

中文摘要:我們展示了在地面運行的1 cm² × 1 mm厚(0.233克)高解像度非熱聲子探測器中,對自旋無關的暗物質-核子相互作用的搜索結果。該傳感器實現了σ_P = 361.5(4)毫電子伏特的能量解像度,這是迄今為止任何非熱聲子探測器的最佳解像度。通過0.233克 × 12小時的曝光量,我們對44至87兆電子伏特/平方c之間的暗物質質量設定了最嚴格的限制,最低未探索的截面為4e-32平方厘米,對應87兆電子伏特/平方c。我們採用了一種保守的鹽化技術,達到了迄今為止通過直接探測實驗探測到的最低暗物質質量。這一限制是通過雙通道抑制與單個傳感器耦合的低能背景實現的。

摘要

  • 原文標題:Towards Understanding Distilled Reasoning Models: A Representational Approach
  • 中文標題:理解蒸餾推理模型:一種表徵方法
  • 發佈日期:2025-03-05 18:40:19+00:00
  • 作者:David D. Baek, Max Tegmark
  • 分類:cs.LG
  • 原文連結http://arxiv.org/abs/2503.03730v1

中文摘要:在本文中,我們研究了模型蒸餾如何影響大型語言模型(LLMs)中推理特徵的發展。為了探索這一點,我們在Qwen系列模型及其微調變體上訓練了一個跨編碼器。我們的結果表明,跨編碼器學習了與各種推理類型相對應的特徵,包括自我反思計算驗證。此外,我們觀察到蒸餾模型包含獨特的推理特徵方向,這些方向可用於引導模型進入過度思考敏銳思考模式。特別是,我們對四種特定的推理類別進行了分析:(a)自我反思,(b)演繹推理,(c)替代推理,以及(d)對比推理。最後,我們研究了蒸餾過程導致的特徵幾何變化,並發現較大的蒸餾模型可能會發展出更具結構化的表示,這與增強的蒸餾性能相關。通過提供關於蒸餾如何修改模型的見解,我們的研究有助於提高AI系統透明度可靠性

摘要

  • 原文標題:Active 6D Pose Estimation for Textureless Objects using Multi-View RGB Frames
  • 中文標題:使用多視角RGB幀進行無紋理物體的主動6D姿態估計
  • 發佈日期:2025-03-05 18:28:32+00:00
  • 作者:Jun Yang, Wenjie Xue, Sahar Ghavidel, Steven L. Waslander
  • 分類:cs.CV, cs.RO
  • 原文連結http://arxiv.org/abs/2503.03726v1

中文摘要:從RGB圖像中估計無紋理物體的6D姿態機械人學中的一個重要問題。由於外觀模糊性、旋轉對稱性和嚴重遮擋,基於單視圖的6D姿態估計器仍然無法處理廣泛的物體,這促使了多視圖姿態估計最佳視角預測的研究,以解決這些限制。在這項工作中,我們提出了一個全面的主動感知框架,僅使用RGB圖像來估計無紋理物體的6D姿態。我們的方法基於一個關鍵思想:將6D姿態估計解耦為一個順序的兩步過程可以顯著提高準確性和效率。首先,我們估計每個物體的3D平移,解決RGB圖像固有的尺度和深度模糊性。然後,這些估計用於簡化後續的3D方向確定任務,我們通過規範尺度模板匹配來實現。基於這一公式,我們進一步引入了一種主動感知策略,預測下一個最佳相機視角以捕捉RGB圖像,有效減少物體姿態的不確定性並提高姿態準確性。我們在公開的ROBI數據集以及我們自己創建的透明物體數據集上評估了我們的方法。在使用相同相機視角進行評估時,我們的多視圖姿態估計顯著優於最先進的方法。此外,通過利用我們的最佳視角策略,我們的方法在比基於啟發式策略更少的視角下實現了高物體姿態準確性。

摘要

  • 原文標題:Exploring Dual-Iron Atomic Catalysts for Efficient Nitrogen Reduction: A Comprehensive Study on Structural and Electronic Optimization
  • 中文標題:探索雙鐵原子催化劑用於高效氮還原:結構與電子優化的綜合研究
  • 發佈日期:2025-03-05 12:00:44+00:00
  • 作者:Zhe Zhang, Wenxin Ma, Jiajie Qiao, Xiaoliang Wu, Shaowen Yu, Weiye Hou, Xiang Huang, Rubin Huo, Hongbo Wu, Yusong Tu
  • 分類:cond-mat.mtrl-sci, physics.chem-ph
  • 原文連結http://arxiv.org/abs/2503.03427v1

中文摘要氮還原反應(NRR)作為一種高效且綠色的氨合成途徑,在實現按需氨生產中起着至關重要的作用。本研究提出了一種基於雙鐵原子位點和氮硼共摻雜石墨烯催化劑的新設計理念,探索其在NRR中的高效性。通過調節N和B的共摻雜比例,我們發現Fe2N3B@G催化劑在N2分子的吸附和氫化中表現出顯著的活性,尤其是在NRR遠端路徑上具有最低的自由能(0.32 eV),顯示出其優異的氮活化能力和NRR性能。計算的電子局域化函數晶體軌道哈密頓布居靜電勢圖揭示了Fe2N3B@G催化劑改進的NRR動力學源於N3B共摻雜誘導的Fe-Fe電子環境優化、Fe-N鍵強度的調節以及N2斷裂和氫化過程中的持續電子支持。特別是,機器學習分子動力學(MLMD)模擬被用來驗證Fe2N3B@G催化劑在NRR中的高活性,結果表明Fe2N3B@G有效調節了Fe-N鍵的電子密度,確保了NH3分子的順利生成和解吸,並避免了與析氫反應(HER)的競爭。此外,Fe2N3B@G催化劑確定的較高HER過電位可以有效抑制HER並增強對NRR的選擇性。此外,Fe2N3B@G催化劑在高達500 K的分子動力學模擬中也表現出良好的熱穩定性,為其在實際應用中的可行性提供了支持。本研究展示了Fe2N3B@G在氮還原催化中的優越性能,並通過共摻雜策略和深入的電子環境調節為原子催化劑設計提供了理論指導。

摘要

  • 原文標題:A Multimodal Framework for Topic Propagation Classification in Social Networks
  • 中文標題:社交網絡中話題傳播分類的多模態框架
  • 發佈日期:2025-03-05 02:12:23+00:00
  • 作者:Yuchuan Jiang, Chaolong Jia, Yunyi Qin, Wei Cai, Yongsen Qian
  • 分類:cs.SI, cs.AI, cs.NE
  • 原文連結http://arxiv.org/abs/2503.03112v1

中文摘要互聯網的快速發展和社交網絡的廣泛採用顯著加速了信息傳播。然而,這種轉變也帶來了信息捕獲信息處理的複雜性,給研究人員和實踐者帶來了巨大挑戰。因此,預測社交網絡中與主題相關的信息傳播已成為一個關鍵的研究焦點。本文通過整合從關鍵傳播特徵中提取的多維特徵,提出了一種用於社交網絡中主題傳播的預測模型。具體而言,我們在PageRank算法中引入了兩個新指標——用戶關係廣度用戶權威性,以更有效地量化用戶影響力。此外,我們採用Text-CNN模型進行情感分類,從文本內容中提取情感特徵。節點的時序嵌入通過Bi-LSTM模型進行編碼,以捕捉時序動態。此外,我們改進了用戶與主題交互痕跡的測量方法,用更精確的傳播特徵度量替代了傳統的主題瀏覽量指標。最後,我們使用Transformer模型整合提取的多維特徵,顯著提升了預測性能。實驗結果表明,我們提出的模型在FI-ScoreAUCRecall方面優於傳統的機器學習單模態深度學習模型,驗證了其在預測社交網絡中主題傳播方面的有效性。

摘要

  • 原文標題:Improving LLM Safety Alignment with Dual-Objective Optimization
  • 中文標題:通過雙目標優化改進大語言模型的安全對齊
  • 發佈日期:2025-03-05 18:01:05+00:00
  • 作者:Xuandong Zhao, Will Cai, Tianneng Shi, David Huang, Licong Lin, Song Mei, Dawn Song
  • 分類:cs.CL, cs.CR, cs.LG
  • 原文連結http://arxiv.org/abs/2503.03710v1

中文摘要:現有的大型語言模型(LLMs)訓練時安全對齊技術在面對越獄攻擊時仍然脆弱。直接偏好優化DPO)作為一種廣泛部署的對齊方法,在實驗和理論背景下都表現出局限性,因為其損失函數在拒絕學習方面被證明是次優的。通過基於梯度的分析,我們識別了這些不足,並提出了一種改進的安全對齊方法,將DPO目標分解為兩個部分:(1)魯棒的拒絕訓練,即使在生成部分不安全內容時也鼓勵拒絕;(2)有針對性地遺忘有害知識。這種方法顯著提高了LLM在面對各種越獄攻擊時的魯棒性,包括預填充後綴多輪攻擊,涵蓋分佈內分佈外場景。此外,我們引入了一種方法,通過結合基於獎勵的令牌級加權機制來強調關鍵的拒絕令牌,從而進一步提高對抗性攻擊的魯棒性。我們的研究還表明,對越獄攻擊的魯棒性與訓練過程中令牌分佈的偏移以及拒絕和有害令牌的內部表示相關,為未來LLM安全對齊研究提供了有價值的方向。代碼可在https://github.com/wicai24/DOOR-Alignment獲取。

摘要

  • 原文標題:Fast and Precise Spectral Analysis for Dark Matter Searches with LIGO
  • 中文標題:快速精確的頻譜分析用於LIGO暗物質搜索
  • 發佈日期:2025-03-05 09:18:14+00:00
  • 作者:Alexandre Göttel, Vivien Raymond
  • 分類:astro-ph.CO, gr-qc
  • 原文連結http://arxiv.org/abs/2503.03293v1

中文摘要:我們引入了一種新穎的對數譜估計方法,用於利用引力波探測器進行暗物質搜索,將已建立的暗物質搜索技術計算機音樂分析的見解相結合。通過利用時域頻域之間的對稱性,該方法在計算效率上與基於FFT的算法相當,但不像這些算法那樣犧牲精度。我們將這種方法應用於LIGO第三次觀測運行的數據,直接將其性能與之前的搜索進行比較。我們的結果顯示,在幾乎整個頻率範圍內,性能一致提高了15%,且無需額外的計算成本。隨着進一步改進的潛力,該方法已經提供了一種能夠最大化當前和未來引力波觀測站科學潛力的解決方案。

摘要

  • 原文標題:Nanocavity-Enhanced Second-Harmonic Generation from Colossal Quantum Dots
  • 中文標題:納米腔增強的巨量子點二次諧波產生
  • 發佈日期:2025-03-05 00:22:01+00:00
  • 作者:David Sharp, Abhinav Kala, Hannah Rarick, Hao A. Nguyen, Elise Skytte, Brandi M. Cossairt, Arka Majumdar
  • 分類:physics.optics, physics.app-ph
  • 原文連結http://arxiv.org/abs/2503.03072v1

中文摘要膠體量子點(QDs)是非線性光學和與光子器件確定性異質集成的有吸引力的介質。通過將量子點耦合到低模體積的光子納米腔中,可以進一步增強其固有的非線性特性,從而實現低功耗的片上非線性光學。在本文中,我們通過將巨型量子點氮化矽納米束腔集成,展示了腔增強的二次諧波產生。通過使用超快脈衝激光泵浦腔-量子點系統,我們觀察到腔耦合量子點產生了強烈的二次諧波,並估計增強因子約為3,040。我們的工作,結合之前報道的巨型量子點的確定性定位,可以為低功耗非線性光學提供一個可擴展的量子點-腔平台。

摘要

  • 原文標題:Sublinear Data Structures for Nearest Neighbor in Ultra High Dimensions
  • 中文標題:超維空間中最近鄰的次線性數據結構
  • 發佈日期:2025-03-05 00:37:39+00:00
  • 作者:Martin G. Herold, Danupon Nanongkai, Joachim Spoerhase, Nithin Varma, Zihang Wu
  • 分類:cs.DS, cs.CG
  • 原文連結http://arxiv.org/abs/2503.03079v1

中文摘要幾何數據結構在維度遠小於輸入點數量的情況下得到了廣泛研究。然而,在機器學習的許多場景中,維度可能遠高於點的數量,甚至高到數據結構無法讀取和存儲輸入點和查詢點的所有坐標。受這些場景以及特徵選擇可解釋聚類相關研究的啟發,我們開始研究這種超高維情況下的幾何數據結構。我們的重點是**近似最近鄰**問題。在該問題中,給定一組$n$個點$C\subseteq \mathbb{R}^d$,需要生成一個**小型**數據結構,能夠**快速**回答以下查詢:給定$q\in \mathbb{R}^d$,返回一個近似最近的點$c\in C$。本文的主要問題是:**當$d\gg n$時,是否存在具有次線性($o(nd)$)空間和次線性($o(d)$)查詢時間的數據結構?** 在本文中,我們肯定地回答了這個問題。我們提出了$(1+\epsilon)$-近似數據結構,並給出了以下保證。對於$\ell_1$-和$\ell_2$-範數距離:$\tilde O(n \log(d)/\mathrm{poly}(\epsilon))$空間和$\tilde O(n/\mathrm{poly}(\epsilon))$查詢時間。我們證明了這些空間和時間界限在$\mathrm{poly}{(\log n/\epsilon)}$因子內是緊的。對於$\ell_p$-範數距離:$\tilde O(n^2 \log(d) (\log\log (n)/\epsilon)^p)$空間和$\tilde O\left(n(\log\log (n)/\epsilon)^p\right)$查詢時間。通過簡單的歸約,我們的數據結構暗示了其他一些幾何問題的次線性-$d$數據結構;例如,近似正交範圍搜索最遠鄰,並產生了$k$-中位數和$k$-均值聚類的次線性$O(1)$-近似表示。

摘要

  • 原文標題:OTTER: A Vision-Language-Action Model with Text-Aware Visual Feature Extraction
  • 中文標題:OTTER:一種具有文本感知視覺特徵提取的視覺-語言-動作模型
  • 發佈日期:2025-03-05 18:44:48+00:00
  • 作者:Huang Huang, Fangchen Liu, Letian Fu, Tingfan Wu, Mustafa Mukadam, Jitendra Malik, Ken Goldberg, Pieter Abbeel
  • 分類:cs.RO, cs.CV
  • 原文連結http://arxiv.org/abs/2503.03734v1

中文摘要視覺-語言-動作(VLA)模型旨在基於視覺觀察語言指令預測機械人動作。現有方法需要微調預訓練的視覺-語言模型(VLM),因為視覺和語言特徵是獨立輸入到下游策略中的,這會降低預訓練的語義對齊效果。我們提出了OTTER,一種新穎的VLA架構,通過顯式的、文本感知的視覺特徵提取來利用這些現有的對齊。OTTER不是處理所有視覺特徵,而是選擇性地提取並僅傳遞與語言指令語義對齊的任務相關視覺特徵到策略變換器中。這使得OTTER能夠保持預訓練的視覺-語言編碼器凍結。因此,OTTER保留並利用了從大規模預訓練中學到的豐富語義理解,實現了強大的零樣本泛化能力。在仿真真實世界實驗中,OTTER顯著優於現有的VLA模型,展示了對新物體和環境的強大零樣本泛化能力。視頻、代碼、檢查點和數據集:https://ottervla.github.io/。