WikiEdge:ArXiv速遞/2025-03-05
摘要
- 原文標題:First Limits on Light Dark Matter Interactions in a Low Threshold Two Channel Athermal Phonon Detector from the TESSERACT Collaboration
- 中文標題:TESSERACT合作組在低閾值雙通道非熱聲子探測器中首次對輕暗物質相互作用的限制
- 發布日期:2025-03-05 17:22:53+00:00
- 作者:C. L. Chang, Y. -Y. Chang, L. Chaplinsky, C. W. Fink, M. Garcia-Sciveres, W. Guo, S. A. Hertel, X. Li, J. Lin, M. Lisovenko, R. Mahapatra, W. Matava, D. N. McKinsey, V. Novati, P. K. Patel, B. Penning, H. D. Pinckney, M. Platt, M. Pyle, Y. Qi, M. Reed, G. R. C Rischbieter, R. K. Romani, B. Sadoulet, B. Serfass, P. Sorensen, A. Suzuki, V. Velan, G. Wang, Y. Wang, S. L. Watkins, M. R. Williams, J. K. Wuko, T. Aramaki, P. Cushman, N. N. Gite, A. Gupta, M. E. Huber, N. A. Kurinsky, J. S. Mammo, A. J. Mayer, J. Nelson, S. M. Oser, L. Pandey, A. Pradeep, W. Rau, T. Saab
- 分類:hep-ex, physics.ins-det
- 原文鏈接:http://arxiv.org/abs/2503.03683v1
中文摘要:我們展示了在地面運行的1 cm² × 1 mm厚(0.233克)高分辨率硅非熱聲子探測器中,對自旋無關的暗物質-核子相互作用的搜索結果。該傳感器實現了σ_P = 361.5(4)毫電子伏特的能量分辨率,這是迄今為止任何非熱聲子探測器的最佳分辨率。通過0.233克 × 12小時的曝光量,我們對44至87兆電子伏特/平方c之間的暗物質質量設定了最嚴格的限制,最低未探索的截面為4e-32平方厘米,對應87兆電子伏特/平方c。我們採用了一種保守的鹽化技術,達到了迄今為止通過直接探測實驗探測到的最低暗物質質量。這一限制是通過雙通道抑制與單個傳感器耦合的低能背景實現的。
摘要
- 原文標題:Towards Understanding Distilled Reasoning Models: A Representational Approach
- 中文標題:理解蒸餾推理模型:一種表徵方法
- 發布日期:2025-03-05 18:40:19+00:00
- 作者:David D. Baek, Max Tegmark
- 分類:cs.LG
- 原文鏈接:http://arxiv.org/abs/2503.03730v1
中文摘要:在本文中,我們研究了模型蒸餾如何影響大型語言模型(LLMs)中推理特徵的發展。為了探索這一點,我們在Qwen系列模型及其微調變體上訓練了一個跨編碼器。我們的結果表明,跨編碼器學習了與各種推理類型相對應的特徵,包括自我反思和計算驗證。此外,我們觀察到蒸餾模型包含獨特的推理特徵方向,這些方向可用於引導模型進入過度思考或敏銳思考模式。特別是,我們對四種特定的推理類別進行了分析:(a)自我反思,(b)演繹推理,(c)替代推理,以及(d)對比推理。最後,我們研究了蒸餾過程導致的特徵幾何變化,並發現較大的蒸餾模型可能會發展出更具結構化的表示,這與增強的蒸餾性能相關。通過提供關於蒸餾如何修改模型的見解,我們的研究有助於提高AI系統的透明度和可靠性。
摘要
- 原文標題:Active 6D Pose Estimation for Textureless Objects using Multi-View RGB Frames
- 中文標題:使用多視角RGB幀進行無紋理物體的主動6D姿態估計
- 發布日期:2025-03-05 18:28:32+00:00
- 作者:Jun Yang, Wenjie Xue, Sahar Ghavidel, Steven L. Waslander
- 分類:cs.CV, cs.RO
- 原文鏈接:http://arxiv.org/abs/2503.03726v1
中文摘要:從RGB圖像中估計無紋理物體的6D姿態是機器人學中的一個重要問題。由於外觀模糊性、旋轉對稱性和嚴重遮擋,基於單視圖的6D姿態估計器仍然無法處理廣泛的物體,這促使了多視圖姿態估計和最佳視角預測的研究,以解決這些限制。在這項工作中,我們提出了一個全面的主動感知框架,僅使用RGB圖像來估計無紋理物體的6D姿態。我們的方法基於一個關鍵思想:將6D姿態估計解耦為一個順序的兩步過程可以顯著提高準確性和效率。首先,我們估計每個物體的3D平移,解決RGB圖像固有的尺度和深度模糊性。然後,這些估計用於簡化後續的3D方向確定任務,我們通過規範尺度模板匹配來實現。基於這一公式,我們進一步引入了一種主動感知策略,預測下一個最佳相機視角以捕捉RGB圖像,有效減少物體姿態的不確定性並提高姿態準確性。我們在公開的ROBI數據集以及我們自己創建的透明物體數據集上評估了我們的方法。在使用相同相機視角進行評估時,我們的多視圖姿態估計顯著優於最先進的方法。此外,通過利用我們的最佳視角策略,我們的方法在比基於啟發式策略更少的視角下實現了高物體姿態準確性。
摘要
- 原文標題:Exploring Dual-Iron Atomic Catalysts for Efficient Nitrogen Reduction: A Comprehensive Study on Structural and Electronic Optimization
- 中文標題:探索雙鐵原子催化劑用於高效氮還原:結構與電子優化的綜合研究
- 發布日期:2025-03-05 12:00:44+00:00
- 作者:Zhe Zhang, Wenxin Ma, Jiajie Qiao, Xiaoliang Wu, Shaowen Yu, Weiye Hou, Xiang Huang, Rubin Huo, Hongbo Wu, Yusong Tu
- 分類:cond-mat.mtrl-sci, physics.chem-ph
- 原文鏈接:http://arxiv.org/abs/2503.03427v1
中文摘要:氮還原反應(NRR)作為一種高效且綠色的氨合成途徑,在實現按需氨生產中起着至關重要的作用。本研究提出了一種基於雙鐵原子位點和氮硼共摻雜石墨烯催化劑的新設計理念,探索其在NRR中的高效性。通過調節N和B的共摻雜比例,我們發現Fe2N3B@G催化劑在N2分子的吸附和氫化中表現出顯著的活性,尤其是在NRR遠端路徑上具有最低的自由能(0.32 eV),顯示出其優異的氮活化能力和NRR性能。計算的電子局域化函數、晶體軌道哈密頓布居、靜電勢圖揭示了Fe2N3B@G催化劑改進的NRR動力學源於N3B共摻雜誘導的Fe-Fe電子環境優化、Fe-N鍵強度的調節以及N2斷裂和氫化過程中的持續電子支持。特別是,機器學習分子動力學(MLMD)模擬被用來驗證Fe2N3B@G催化劑在NRR中的高活性,結果表明Fe2N3B@G有效調節了Fe-N鍵的電子密度,確保了NH3分子的順利生成和解吸,並避免了與析氫反應(HER)的競爭。此外,Fe2N3B@G催化劑確定的較高HER過電位可以有效抑制HER並增強對NRR的選擇性。此外,Fe2N3B@G催化劑在高達500 K的分子動力學模擬中也表現出良好的熱穩定性,為其在實際應用中的可行性提供了支持。本研究展示了Fe2N3B@G在氮還原催化中的優越性能,並通過共摻雜策略和深入的電子環境調節為原子催化劑設計提供了理論指導。
摘要
- 原文標題:A Multimodal Framework for Topic Propagation Classification in Social Networks
- 中文標題:社交網絡中話題傳播分類的多模態框架
- 發布日期:2025-03-05 02:12:23+00:00
- 作者:Yuchuan Jiang, Chaolong Jia, Yunyi Qin, Wei Cai, Yongsen Qian
- 分類:cs.SI, cs.AI, cs.NE
- 原文鏈接:http://arxiv.org/abs/2503.03112v1
中文摘要:互聯網的快速發展和社交網絡的廣泛採用顯著加速了信息傳播。然而,這種轉變也帶來了信息捕獲和信息處理的複雜性,給研究人員和實踐者帶來了巨大挑戰。因此,預測社交網絡中與主題相關的信息傳播已成為一個關鍵的研究焦點。本文通過整合從關鍵傳播特徵中提取的多維特徵,提出了一種用於社交網絡中主題傳播的預測模型。具體而言,我們在PageRank算法中引入了兩個新指標——用戶關係廣度和用戶權威性,以更有效地量化用戶影響力。此外,我們採用Text-CNN模型進行情感分類,從文本內容中提取情感特徵。節點的時序嵌入通過Bi-LSTM模型進行編碼,以捕捉時序動態。此外,我們改進了用戶與主題交互痕跡的測量方法,用更精確的傳播特徵度量替代了傳統的主題瀏覽量指標。最後,我們使用Transformer模型整合提取的多維特徵,顯著提升了預測性能。實驗結果表明,我們提出的模型在FI-Score、AUC和Recall方面優於傳統的機器學習和單模態深度學習模型,驗證了其在預測社交網絡中主題傳播方面的有效性。
摘要
- 原文標題:Improving LLM Safety Alignment with Dual-Objective Optimization
- 中文標題:通過雙目標優化改進大語言模型的安全對齊
- 發布日期:2025-03-05 18:01:05+00:00
- 作者:Xuandong Zhao, Will Cai, Tianneng Shi, David Huang, Licong Lin, Song Mei, Dawn Song
- 分類:cs.CL, cs.CR, cs.LG
- 原文鏈接:http://arxiv.org/abs/2503.03710v1
中文摘要:現有的大型語言模型(LLMs)訓練時安全對齊技術在面對越獄攻擊時仍然脆弱。直接偏好優化(DPO)作為一種廣泛部署的對齊方法,在實驗和理論背景下都表現出局限性,因為其損失函數在拒絕學習方面被證明是次優的。通過基於梯度的分析,我們識別了這些不足,並提出了一種改進的安全對齊方法,將DPO目標分解為兩個部分:(1)魯棒的拒絕訓練,即使在生成部分不安全內容時也鼓勵拒絕;(2)有針對性地遺忘有害知識。這種方法顯著提高了LLM在面對各種越獄攻擊時的魯棒性,包括預填充、後綴和多輪攻擊,涵蓋分布內和分布外場景。此外,我們引入了一種方法,通過結合基於獎勵的令牌級加權機制來強調關鍵的拒絕令牌,從而進一步提高對抗性攻擊的魯棒性。我們的研究還表明,對越獄攻擊的魯棒性與訓練過程中令牌分布的偏移以及拒絕和有害令牌的內部表示相關,為未來LLM安全對齊研究提供了有價值的方向。代碼可在https://github.com/wicai24/DOOR-Alignment獲取。
摘要
- 原文標題:Fast and Precise Spectral Analysis for Dark Matter Searches with LIGO
- 中文標題:快速精確的頻譜分析用於LIGO暗物質搜索
- 發布日期:2025-03-05 09:18:14+00:00
- 作者:Alexandre Göttel, Vivien Raymond
- 分類:astro-ph.CO, gr-qc
- 原文鏈接:http://arxiv.org/abs/2503.03293v1
中文摘要:我們引入了一種新穎的對數譜估計方法,用於利用引力波探測器進行暗物質搜索,將已建立的暗物質搜索技術與計算機音樂分析的見解相結合。通過利用時域和頻域之間的對稱性,該方法在計算效率上與基於FFT的算法相當,但不像這些算法那樣犧牲精度。我們將這種方法應用於LIGO第三次觀測運行的數據,直接將其性能與之前的搜索進行比較。我們的結果顯示,在幾乎整個頻率範圍內,性能一致提高了15%,且無需額外的計算成本。隨着進一步改進的潛力,該方法已經提供了一種能夠最大化當前和未來引力波觀測站科學潛力的解決方案。
摘要
- 原文標題:Nanocavity-Enhanced Second-Harmonic Generation from Colossal Quantum Dots
- 中文標題:納米腔增強的巨量子點二次諧波產生
- 發布日期:2025-03-05 00:22:01+00:00
- 作者:David Sharp, Abhinav Kala, Hannah Rarick, Hao A. Nguyen, Elise Skytte, Brandi M. Cossairt, Arka Majumdar
- 分類:physics.optics, physics.app-ph
- 原文鏈接:http://arxiv.org/abs/2503.03072v1
中文摘要:膠體量子點(QDs)是非線性光學和與光子器件確定性異質集成的有吸引力的介質。通過將量子點耦合到低模體積的光子納米腔中,可以進一步增強其固有的非線性特性,從而實現低功耗的片上非線性光學。在本文中,我們通過將巨型量子點與氮化硅納米束腔集成,展示了腔增強的二次諧波產生。通過使用超快脈衝激光泵浦腔-量子點系統,我們觀察到腔耦合量子點產生了強烈的二次諧波,並估計增強因子約為3,040。我們的工作,結合之前報道的巨型量子點的確定性定位,可以為低功耗非線性光學提供一個可擴展的量子點-腔平台。
摘要
- 原文標題:Sublinear Data Structures for Nearest Neighbor in Ultra High Dimensions
- 中文標題:超維空間中最近鄰的次線性數據結構
- 發布日期:2025-03-05 00:37:39+00:00
- 作者:Martin G. Herold, Danupon Nanongkai, Joachim Spoerhase, Nithin Varma, Zihang Wu
- 分類:cs.DS, cs.CG
- 原文鏈接:http://arxiv.org/abs/2503.03079v1
中文摘要:幾何數據結構在維度遠小於輸入點數量的情況下得到了廣泛研究。然而,在機器學習的許多場景中,維度可能遠高於點的數量,甚至高到數據結構無法讀取和存儲輸入點和查詢點的所有坐標。受這些場景以及特徵選擇和可解釋聚類相關研究的啟發,我們開始研究這種超高維情況下的幾何數據結構。我們的重點是**近似最近鄰**問題。在該問題中,給定一組$n$個點$C\subseteq \mathbb{R}^d$,需要生成一個**小型**數據結構,能夠**快速**回答以下查詢:給定$q\in \mathbb{R}^d$,返回一個近似最近的點$c\in C$。本文的主要問題是:**當$d\gg n$時,是否存在具有次線性($o(nd)$)空間和次線性($o(d)$)查詢時間的數據結構?** 在本文中,我們肯定地回答了這個問題。我們提出了$(1+\epsilon)$-近似數據結構,並給出了以下保證。對於$\ell_1$-和$\ell_2$-範數距離:$\tilde O(n \log(d)/\mathrm{poly}(\epsilon))$空間和$\tilde O(n/\mathrm{poly}(\epsilon))$查詢時間。我們證明了這些空間和時間界限在$\mathrm{poly}{(\log n/\epsilon)}$因子內是緊的。對於$\ell_p$-範數距離:$\tilde O(n^2 \log(d) (\log\log (n)/\epsilon)^p)$空間和$\tilde O\left(n(\log\log (n)/\epsilon)^p\right)$查詢時間。通過簡單的歸約,我們的數據結構暗示了其他一些幾何問題的次線性-$d$數據結構;例如,近似正交範圍搜索、最遠鄰,並產生了$k$-中位數和$k$-均值聚類的次線性$O(1)$-近似表示。
摘要
- 原文標題:OTTER: A Vision-Language-Action Model with Text-Aware Visual Feature Extraction
- 中文標題:OTTER:一種具有文本感知視覺特徵提取的視覺-語言-動作模型
- 發布日期:2025-03-05 18:44:48+00:00
- 作者:Huang Huang, Fangchen Liu, Letian Fu, Tingfan Wu, Mustafa Mukadam, Jitendra Malik, Ken Goldberg, Pieter Abbeel
- 分類:cs.RO, cs.CV
- 原文鏈接:http://arxiv.org/abs/2503.03734v1
中文摘要:視覺-語言-動作(VLA)模型旨在基於視覺觀察和語言指令預測機器人動作。現有方法需要微調預訓練的視覺-語言模型(VLM),因為視覺和語言特徵是獨立輸入到下游策略中的,這會降低預訓練的語義對齊效果。我們提出了OTTER,一種新穎的VLA架構,通過顯式的、文本感知的視覺特徵提取來利用這些現有的對齊。OTTER不是處理所有視覺特徵,而是選擇性地提取並僅傳遞與語言指令語義對齊的任務相關視覺特徵到策略變換器中。這使得OTTER能夠保持預訓練的視覺-語言編碼器凍結。因此,OTTER保留並利用了從大規模預訓練中學到的豐富語義理解,實現了強大的零樣本泛化能力。在仿真和真實世界實驗中,OTTER顯著優於現有的VLA模型,展示了對新物體和環境的強大零樣本泛化能力。視頻、代碼、檢查點和數據集:https://ottervla.github.io/。
摘要
- 原文標題:Towards Trustworthy Federated Learning
- 中文標題:邁向可信的聯邦學習
- 發布日期:2025-03-05 17:25:20+00:00
- 作者:Alina Basharat, Yijun Bian, Ping Xu, Zhi Tian
- 分類:cs.LG, cs.CR, cs.DC
- 原文鏈接:http://arxiv.org/abs/2503.03684v1
中文摘要:本文開發了一個綜合框架,以解決聯邦學習(FL)中的三個關鍵可信挑戰:對抗拜占庭攻擊的魯棒性、公平性和隱私保護。為了提高系統對抗發送惡意信息以偏置系統性能的拜占庭攻擊的防禦能力,我們開發了一種基於雙面範數的篩選機制(TNBS),該機制允許中央服務器裁剪具有最低範數l和最高範數h的梯度。TNBS作為一種篩選工具,用於過濾掉那些梯度與誠實參與者相差甚遠的潛在惡意參與者。為了促進平等公平性,我們採用了q-公平聯邦學習(q-FFL)。此外,我們採用了一種基於差分隱私的方案,以防止本地客戶端的原始數據被好奇方推斷。我們為所提出的框架在不同場景下提供了收斂保證。在真實數據集上的實驗結果表明,所提出的框架在管理隱私與準確性之間的權衡的同時,有效地提高了魯棒性和公平性。這項工作似乎是第一個在實驗和理論上同時解決可信FL中公平性、隱私和魯棒性的研究。
摘要
- 原文標題:Effective LLM Knowledge Learning via Model Generalization
- 中文標題:通過模型泛化實現有效的LLM知識學習
- 發布日期:2025-03-05 17:56:20+00:00
- 作者:Mingkang Zhu, Xi Chen, Zhongdao Wang, Bei Yu, Hengshuang Zhao, Jiaya Jia
- 分類:cs.CL, cs.LG
- 原文鏈接:http://arxiv.org/abs/2503.03705v1
中文摘要:大型語言模型(LLMs)在包含廣泛世界知識的海量文檔上進行訓練。然而,通過自回歸預訓練如何獲取知識仍然沒有得到很好的理解。這種理解的缺乏極大地阻礙了有效的知識學習,特別是在對最新信息進行持續預訓練時,因為這些不斷變化的信息通常缺乏像基礎知識那樣的多樣化重複。在本文中,我們專注於理解和改進LLM的知識學習。我們發現並驗證了LLM的知識學習可以被視為隱藏在自回歸預訓練目標中的隱式監督任務。我們的研究結果表明,LLM的知識學習將受益於旨在提高監督任務泛化能力的方法。基於我們的分析,我們提出了基於格式化的數據增強方法,以增加分布內樣本,這種方法不會像文本改寫那樣改變文檔中嵌入的事實。我們還引入了銳度感知最小化作為一種有效的優化算法,以更好地提高泛化能力。此外,我們的分析和方法可以輕鬆擴展到指令微調。大量的實驗結果驗證了我們的發現,並展示了我們的方法在持續預訓練和指令微調中的有效性。本文為解釋和設計LLM知識學習的有效策略提供了新的視角和見解。
摘要
- 原文標題:DualDiff+: Dual-Branch Diffusion for High-Fidelity Video Generation with Reward Guidance
- 中文標題:DualDiff+:基於獎勵引導的雙分支擴散模型用於高保真視頻生成
- 發布日期:2025-03-05 17:31:45+00:00
- 作者:Zhao Yang, Zezhong Qian, Xiaofan Li, Weixiang Xu, Gongpeng Zhao, Ruohong Yu, Lingsi Zhu, Longjun Liu
- 分類:cs.CV
- 原文鏈接:http://arxiv.org/abs/2503.03689v1
中文摘要:準確且高保真的駕駛場景重建需要有效利用全面的場景信息作為條件輸入。現有方法主要依賴於3D邊界框和BEV道路地圖進行前景和背景控制,這些方法無法捕捉駕駛場景的全部複雜性,也無法充分整合多模態信息。在這項工作中,我們提出了DualDiff,一種雙分支條件擴散模型,旨在增強多視圖和視頻序列中的駕駛場景生成。具體來說,我們引入了占用射線形狀採樣(ORS)作為條件輸入,提供了豐富的前景和背景語義以及3D空間幾何信息,以精確控制兩者的生成。為了改善細粒度前景對象(特別是複雜和遠距離對象)的合成,我們提出了一種前景感知掩碼(FGM)去噪損失函數。此外,我們開發了語義融合注意力(SFA)機制,以動態優先處理相關信息並抑制噪聲,從而實現更有效的多模態融合。最後,為了確保高質量的圖像到視頻生成,我們引入了獎勵引導擴散(RGD)框架,該框架在生成的視頻中保持全局一致性和語義連貫性。大量實驗表明,DualDiff在多個數據集上實現了最先進的(SOTA)性能。在NuScenes數據集上,DualDiff將FID分數降低了4.09%。在下游任務中,如BEV分割,我們的方法將車輛mIoU提高了4.50%,道路mIoU提高了1.70%,而在BEV 3D目標檢測中,前景mAP提高了1.46%。代碼將在https://github.com/yangzhaojason/DualDiff上提供。
摘要
- 原文標題:When Radiation Meets Linux: Analyzing Soft Errors in Linux on COTS SoCs under Proton Irradiation
- 中文標題:當輻射遇上Linux:質子輻照下商用SoC上Linux軟錯誤分析
- 發布日期:2025-03-05 18:21:34+00:00
- 作者:Saad Memon, Rafal Graczyk, Tomasz Rajkowski, Jan Swakon, Damian Wrobel, Sebastian Kusyk, Mike Papadakis
- 分類:cs.OS, cs.AR, cs.SE
- 原文鏈接:http://arxiv.org/abs/2503.03722v1
中文摘要:在空間計算中,越來越多地使用商用現成(COTS)系統級芯片(SoC)上的 Linux 系統,這繼承了 COTS 對輻射引起的故障(如軟錯誤)的敏感性。現代 SoC 加劇了這一問題,因為激進的晶體管縮放降低了引發軟錯誤的關鍵電荷閾值,並增加了密集排列晶體管中的輻射效應,從而降低了整體可靠性。Linux 的單片架構放大了這些風險,因為緊密耦合的內核子系統將錯誤傳播到關鍵組件(例如內存管理),而有限的糾錯碼(ECC)提供的緩解效果有限。此外,缺乏在運行 Linux 的 COTS SoC 上進行輻照測試的公開軟錯誤數據,阻礙了可靠性的改進。本研究評估了質子輻照(20-50 MeV)對三種 COTS SoC 架構上的 Linux 的影響:Raspberry Pi Zero 2 W(40 nm CMOS,Cortex-A53)、NXP i.MX 8M Plus(14 nm FinFET,Cortex-A53)和 OrangeCrab(40 nm FPGA,RISC-V)。輻照結果表明,與兩種 40 nm CMOS 對應物相比,14 nm FinFET NXP SoC 在沒有 ECC 內存的情況下實現了 2-3 倍的 Linux 正常運行時間,部分原因是 FinFET 減少了電荷收集。此外,本研究首次對現代 SoC 中易發生軟錯誤的 Linux 內核組件進行了跨架構分析,以開發有針對性的緩解措施。研究結果為 Linux 在 COTS SoC 中的軟錯誤敏感性提供了基礎數據,為空間應用的任務準備提供了指導。
摘要
- 原文標題:Neural Models of Task Adaptation: A Tutorial on Spiking Networks for Executive Control
- 中文標題:神經任務適應模型:關於執行控制的脈衝網絡教程
- 發布日期:2025-03-05 00:44:34+00:00
- 作者:Ashwin Viswanathan Kannan, Madhumitha Ganesan
- 分類:q-bio.NC, cs.LG, cs.NE
- 原文鏈接:http://arxiv.org/abs/2503.03784v1
中文摘要:理解神經系統中認知靈活性和任務切換機制需要生物上可信的計算模型。本教程逐步介紹了如何構建一個脈衝神經網絡(SNN),以模擬認知控制網絡中的任務切換動態。該模型結合了生物上真實的特徵,包括側向抑制、通過無監督的脈衝時間依賴可塑性(STDP)實現的自適應突觸權重,以及在生理相關範圍內的精確神經元參數化。該SNN使用漏電積分-發放(LIF)神經元實現,代表興奮性(穀氨酸能)和抑制性(GABA能)神經元群體。我們利用兩個真實世界的數據集作為任務,展示了網絡如何學習並在它們之間動態切換。實驗設計遵循認知心理學範式,以分析神經適應性、突觸權重修改以及湧現行為,如長時程增強(LTP)、長時程抑制(LTD)和任務集重構(TSR)。通過一系列結構化實驗,本教程展示了任務切換間隔的變化如何影響性能和多任務效率。結果與實驗觀察到的神經元響應一致,為執行功能的計算基礎提供了見解。通過遵循本教程,研究人員可以開發和擴展受生物啟發的SNN模型,用於研究認知過程和神經適應性。
摘要
- 原文標題:Optimal Beamforming for Multi-Target Multi-User ISAC Exploiting Prior Information: How Many Sensing Beams Are Needed?
- 中文標題:利用先驗信息的多目標多用戶ISAC最優波束成形:需要多少感知波束?
- 發布日期:2025-03-05 14:46:33+00:00
- 作者:Jiayi Yao, Shuowen Zhang
- 分類:cs.IT, eess.SP, math.IT
- 原文鏈接:http://arxiv.org/abs/2503.03560v1
中文摘要:本文研究了一種多目標多用戶集成感知與通信(ISAC)系統,其中多天線基站(BS)在下行鏈路中與多個單天線用戶通信,並基於目標反射的回波信號及其先驗概率信息,感知多個目標的未知隨機角度信息。我們關注一種通用的波束成形結構,該結構包含通信波束和專用感知波束,其設計非常複雜,因為更多的感知波束提供了感知的靈活性,但會引入額外的通信干擾。為了解決這一權衡,我們首先將周期性後驗克拉美羅下界(PCRB)表徵為多目標感知中均周期誤差(MCE)的下界。然後,我們優化波束成形,以最小化所有目標中的最大周期性PCRB,確保公平性,同時滿足多個用戶的個體通信速率約束。儘管該問題是非凸的,我們通過利用半定鬆弛(SDR)提出了一種通用的最優解構造方法,並推導了所需感知波束數量的一般界限。此外,我們揭示了各種情況下最優解的具體結構,並推導了所需感知波束數量的更緊界限(例如,在嚴格的速率約束或同質目標下,不需要或最多只需要一個感知波束)。接下來,我們研究了在用戶速率約束下最小化總周期性PCRB的波束成形優化。通過應用SDR,我們提出了一種通用的最優解構造方法及其具體結構,從而降低了計算複雜度。我們推導了所需感知波束數量的一般界限和各種更緊界限。數值結果驗證了我們的分析以及所提出的波束成形設計的有效性。
摘要
- 原文標題:Benchmarking Dynamic SLO Compliance in Distributed Computing Continuum Systems
- 中文標題:分布式計算連續體系統中的動態SLO合規性基準測試
- 發布日期:2025-03-05 08:56:26+00:00
- 作者:Alfreds Lapkovskis, Boris Sedlak, Sindri Magnússon, Schahram Dustdar, Praveen Kumar Donta
- 分類:cs.DC, cs.AI, cs.LG, cs.NI, cs.PF
- 原文鏈接:http://arxiv.org/abs/2503.03274v1
中文摘要:在分布式計算連續體系統(DCCS)等大規模架構中,由於其異構性質以及不同設備和應用程序之間的服務需求差異,確保服務水平目標(SLOs)具有挑戰性。此外,不可預測的工作負載和資源限制導致性能波動和SLO違規。為了提高DCCS中的SLO合規性,一種可能性是應用機器學習;然而,設計選擇通常留給開發人員。為此,我們提供了一個基準測試,將來自神經科學的新興方法——主動推理——與三種成熟的強化學習算法(深度Q網絡、優勢演員-評論家和近端策略優化)進行比較。我們考慮了一個現實的DCCS用例:一個運行視頻會議應用程序的邊設備與一個流媒體視頻的WebSocket服務器並行運行。使用其中一種算法,我們持續監控關鍵性能指標,如延遲和帶寬使用情況,以動態調整參數——包括流數量、幀率和分辨率——以優化服務質量和用戶體驗。為了測試算法對系統持續變化的適應性,我們模擬了動態變化的SLOs以及即時和漸進的數據偏移場景,如網絡帶寬限制和設備熱狀態的波動。儘管評估的算法都顯示出優勢和局限性,但我們的研究結果表明,主動推理是確保DCCS中SLO合規性的一種有前途的方法,具有較低的內存使用、穩定的CPU利用率和快速收斂的特點。
摘要
- 原文標題:RiskAgent: Autonomous Medical AI Copilot for Generalist Risk Prediction
- 中文標題:RiskAgent:用於通用風險預測的自主醫療AI副駕駛
- 發布日期:2025-03-05 18:46:51+00:00
- 作者:Fenglin Liu, Jinge Wu, Hongjian Zhou, Xiao Gu, Soheila Molaei, Anshul Thakur, Lei Clifton, Honghan Wu, David A. Clifton
- 分類:cs.LG, cs.AI, cs.MA
- 原文鏈接:http://arxiv.org/abs/2503.03802v1
中文摘要:大型語言模型(LLMs)在各種臨床應用中的應用吸引了越來越多的研究關注。然而,現實世界的臨床決策與當前工作中常用的標準化、考試式場景有顯著差異。在本文中,我們提出了RiskAgent系統,用於執行廣泛的醫療風險預測,涵蓋超過387種複雜疾病的風險場景,例如心血管疾病和癌症。RiskAgent旨在與數百種臨床決策工具協作,即基於循證醫學支持的風險計算器和評分系統。為了評估我們的方法,我們構建了首個專門用於風險預測的基準MedRisk,包括12,352個問題,涵蓋154種疾病、86種症狀、50個專業和24個器官系統。結果表明,我們的RiskAgent擁有80億模型參數,達到了76.33%的準確率,優於最新的商用LLMs,如o1、o3-mini和GPT-4.5,並將GPT-4o的38.39%準確率提高了一倍。在罕見疾病(如特發性肺纖維化(IPF))上,RiskAgent分別比o1和GPT-4.5高出27.27%和45.46%的準確率。最後,我們進一步在外部循證診斷基準上進行了泛化評估,結果顯示我們的RiskAgent取得了最佳結果。這些令人鼓舞的結果展示了我們的解決方案在多樣化診斷領域的巨大潛力。為了提高模型在不同場景中的適應性,我們構建並開源了一系列從10億到700億參數的模型。我們的代碼、數據和模型均可通過https://github.com/AI-in-Health/RiskAgent獲取。
摘要
- 原文標題:A Graph Width Perspective on Partially Ordered Hamiltonian Paths
- 中文標題:從圖寬度視角看部分有序哈密頓路徑
- 發布日期:2025-03-05 14:41:59+00:00
- 作者:Jesse Beisegel, Katharina Klost, Kristin Knorr, Fabienne Ratajczak, Robert Scheffler
- 分類:cs.DM, cs.CC, cs.DS, math.CO
- 原文鏈接:http://arxiv.org/abs/2503.03553v1
中文摘要:我們考慮在頂點集上以偏序形式存在優先約束的哈密爾頓路徑問題,該問題被稱為偏序哈密爾頓路徑問題(POHPP)。本文研究了圖寬度參數的複雜性,對於這些參數,普通哈密爾頓路徑問題屬於 $\mathsf{FPT}$。我們證明了對於路徑寬度為 4 的圖,POHPP 是 $\mathsf{NP}$-完全的。我們通過給出路徑寬度為 3 和樹寬度為 2 的圖的多項式時間算法來補充這一結果。此外,我們證明了對於團覆蓋數為 2 的圖,POHPP 是 $\mathsf{NP}$-難的,並且對於某些距離到 $\mathcal{G}$ 的參數(包括距離到路徑和距離到團),POHPP 是 $\mathsf{W[1]}$-難的。此外,我們還針對距離到塊和反饋邊集數等參數提出了 $\mathsf{XP}$ 和 $\mathsf{FPT}$ 算法。
摘要
- 原文標題:Bounding the computational power of bosonic systems
- 中文標題:限制玻色子系統的計算能力
- 發布日期:2025-03-05 15:33:51+00:00
- 作者:Varun Upreti, Ulysse Chabaud
- 分類:quant-ph, cs.CC
- 原文鏈接:http://arxiv.org/abs/2503.03600v1
中文摘要:玻色量子系統在無限維希爾伯特空間中運行,這與離散變量量子系統不同。這種獨特的數學結構導致了量子信息處理中的根本性差異,例如狀態層析的指數級複雜度增加 [MMB+24] 或恆定空間中的因式分解算法 [BCCRK24]。然而,尚不清楚玻色系統的這種結構差異是否也能轉化為相對於有限維量子計算機的實際計算優勢。本文通過展示通用玻色量子計算可以在經典計算機上以指數時間模擬,顯著改進了之前需要指數內存的最佳上界 [CJMM24],從而朝着回答這一問題邁出了一步。在複雜性理論術語中,我們將 $\textsf{CVBQP}$ 的最佳上界從 $\textsf{EXPSPACE}$ 改進為 $\textsf{EXP}$。這一結果是通過基於有限能量截斷和近似相干態分解的模擬策略實現的。雖然我們提出了可能改進這一上界的方法,但也提出了支持玻色量子計算機相對於離散變量量子計算機具有指數計算優勢的合理性的論據。此外,我們強調了電路能量作為一種資源的作用,並討論了為什麼它可能成為在實際實現中實現這一優勢的根本瓶頸。
摘要
- 原文標題:Techniques in high-speed imaging and X-ray micro-computed tomography for characterisation of iron ore fragmentation
- 中文標題:高速成像和X射線顯微計算機斷層掃描技術在鐵礦石破碎表徵中的應用
- 發布日期:2025-03-05 04:13:29+00:00
- 作者:Aleese Barron, Yulai Zhang, Neelima Kandula, Matthew Shadwell, Scott Bensley, Tim Evans, Louisa O'Connor, Mark Knackstedt, Nicolas Francois
- 分類:physics.geo-ph
- 原文鏈接:http://arxiv.org/abs/2503.03163v1
中文摘要:岩石的破碎和斷裂對鐵礦石的開採和提取至關重要。斷裂能量需求以及由此產生的礦石顆粒大小和礦物分布是理解和優化採礦和加工實踐的關鍵。本研究結合高速成像和實驗性X射線微CT(微計算機斷層掃描)成像與3D圖像分析,研究了鐵礦石顆粒的破碎過程。本文通過一個富含赤鐵礦的鐵礦石顆粒的案例研究,展示了該成像程序的應用及其產生的結果。在高速攝像機用於在定製落錘試驗中捕捉顆粒斷裂的動態過程之前,該顆粒進行了微CT掃描,以50微秒的分辨率捕捉顆粒斷裂和隨後破碎的動態過程。產生的碎片被收集、進行微CT掃描,並通過顆粒形狀、大小和體積進行三維分析。
摘要
- 原文標題:Positivity of generalized cluster scattering diagrams
- 中文標題:廣義簇散射圖的正性
- 發布日期:2025-03-05 18:17:03+00:00
- 作者:Amanda Burcroff, Kyungyong Lee, Lang Mou
- 分類:math.CO, math.AC, math.AG, math.RA, math.RT, 13F60, 05E10, 14N35
- 原文鏈接:http://arxiv.org/abs/2503.03719v1
中文摘要:我們引入了一類新的組合對象,稱為緊緻分級,它們是定義在極大Dyck路徑上的非負整數值函數。利用緊緻分級,我們推導出了任意二階廣義簇散射圖中牆函數的顯式正公式。進一步,我們證明了任何一致的二階散射圖在初始牆函數係數下都是正的。此外,我們的公式還給出了加權射影平面上相對Gromov-Witten不變量以及完全二分箭圖上框架穩定表示模空間的歐拉特徵的顯式表達式。最後,通過利用二階正性,我們證明了任意高階廣義簇散射圖都具有正的牆函數,從而證明了Laurent現象的正性以及Chekhov-Shapiro廣義簇代數的強正性。
摘要
- 原文標題:On minimizing cyclists' ascent times: Part II
- 中文標題:關於最小化自行車手爬坡時間的研究:第二部分
- 發布日期:2025-03-05 07:28:22+00:00
- 作者:Len Bos, Michael A. Slawinski, Raphaël A. Slawinski, Theodore Stanoev
- 分類:physics.class-ph
- 原文鏈接:http://arxiv.org/abs/2503.03235v1
中文摘要:我們在平均功率、最大功率和最小功率的約束下,制定了自行車爬坡時間的優化方案。與本研究的第一部分不同,我們不再限制出發為飛行起步,即初始速度由模型及其優化決定。我們允許各種初始速度,從靜止到啟動起步。我們通過將不連續的分段恆定速度模型推廣為連續的分段線性速度模型來實現這一點。無論初始速度、坡度或爬坡輪廓如何,最優策略都趨向於恆定的地面速度,這與之前更為受限的公式的結論一致。這一新公式使我們能夠比較各種初始速度策略,因此直接適用於競技自行車運動。特別是在由平坦和陡峭路段組成的時間賽中,它有助於決定是否更換自行車,即從更適合平地的自行車更換為更適合爬坡的自行車,這需要停止並重新啟動。
摘要
- 原文標題:Safety Verification of Nonlinear Stochastic Systems via Probabilistic Tube
- 中文標題:非線性隨機系統的概率管安全驗證
- 發布日期:2025-03-05 10:02:25+00:00
- 作者:Zishun Liu, Saber Jafarpour, Yongxin Chen
- 分類:eess.SY, cs.SY, math.ST, stat.TH
- 原文鏈接:http://arxiv.org/abs/2503.03328v1
中文摘要:我們解決了非線性隨機系統的安全驗證問題,特別是證明系統軌跡以高概率保持在安全集內的任務。為了應對這一挑戰,我們採用了集合侵蝕策略,將隨機擾動的影響與確定性動力學解耦。這種方法將安全集上的隨機安全驗證問題轉化為安全集的侵蝕子集上的確定性安全驗證問題。該策略的成功取決於侵蝕的深度,侵蝕深度由概率管確定,概率管限制了隨機軌跡相對於其對應的確定性軌跡的偏差。我們的主要貢獻是建立了非線性隨機系統概率管的緊界。為了獲得隨機軌跡的概率界,我們採用了基於鞅的方法。核心創新在於設計了一種與平均矩生成函數相關的新型能量函數,該函數形成了一個仿射鞅,這是傳統c-鞅的推廣。利用這種能量函數,我們推導出了概率管的精確界。此外,我們通過結合嚴格收縮動力學的聯合界不等式來增強這一界。通過將推導出的概率管集成到集合侵蝕策略中,我們證明了非線性隨機系統的安全驗證問題可以簡化為確定性安全驗證問題。我們的理論結果通過基於可達性的安全驗證和安全控制器綜合的應用得到了驗證,並附有多個數值示例來說明其有效性。
摘要
- 原文標題:Polydispersity-driven dynamical differences between two- and three-dimensional supercooled liquids
- 中文標題:多分散性驅動的二維和三維過冷液體之間的動力學差異
- 發布日期:2025-03-05 09:54:44+00:00
- 作者:Ilian Pihlajamaa, Lotte van Gessel, Corentin Laudicina, Luc van Burik, Liesbeth Janssen
- 分類:cond-mat.soft, cond-mat.mtrl-sci, cond-mat.stat-mech, physics.chem-ph
- 原文鏈接:http://arxiv.org/abs/2503.03320v1
中文摘要:先前的研究表明,多分散過冷液體的弛豫動力學存在一個難題。研究表明,在二維情況下,隨着材料冷卻,不同尺寸粒子的相對弛豫時間變得更加相似,而在三維情況下則相反:它們解耦。本文解決了這一難題。首先,我們證明在二維中觀察到的耦合是由於引入籠修正以解釋Mermin-Wagner漲落而產生的假象。實際上,二維中小粒子和大粒子的相對弛豫時間隨溫度保持恆定或略微解耦,與三維中觀察到的顯著解耦相反。通過進一步研究這些維度差異,我們通過移動團簇分析發現,小粒子在兩個維度中都啟動了弛豫。隨着團簇增大,在三維中團簇仍然由小粒子主導,而在二維中團簇增長變得與粒子尺寸無關。我們通過研究系統中單粒子勢壘高度的分布,用一個最小模型解釋了這些發現,表明小粒子和大粒子的環境存在明顯差異,這取決於維度。這些發現強調了維度在玻璃形成中的關鍵作用,為多分散過冷液體中玻璃化轉變的機制提供了新的見解。
摘要
- 原文標題:Developing and Utilizing a Large-Scale Cantonese Dataset for Multi-Tasking in Large Language Models
- 中文標題:開發並利用大規模粵語數據集進行大語言模型的多任務處理
- 發布日期:2025-03-05 17:53:07+00:00
- 作者:Jiyue Jiang, Alfred Kar Yin Truong, Yanyu Chen, Qinghang Bao, Sheng Wang, Pengan Chen, Jiuming Wang, Lingpeng Kong, Yu Li, Chuan Wu
- 分類:cs.CL
- 原文鏈接:http://arxiv.org/abs/2503.03702v1
中文摘要:高質量的數據資源在學習大型語言模型(LLMs)中起着至關重要的作用,尤其是對於像粵語這樣的低資源語言。儘管粵語擁有超過8500萬母語使用者,但由於普通話的主導地位、粵語社區內部缺乏凝聚力、字符編碼和輸入方法的多樣性,以及海外粵語使用者傾向於使用英語等因素,粵語在自然語言處理(NLP)領域仍被視為低資源語言。此外,粵語豐富的口語詞彙、英語借詞和語碼轉換特性增加了語料庫收集和處理的複雜性。為了解決這些挑戰,我們從多種來源收集粵語文本,包括開源語料庫、香港特定論壇、維基百科和Common Crawl數據。我們通過語言過濾、質量過濾、內容過濾和去重步驟進行嚴格的數據處理,成功構建了一個包含超過20億個標記的高質量粵語語料庫,用於訓練大型語言模型。我們通過在精選的粵語任務上進行監督微調(SFT)進一步優化模型,增強了其處理特定應用的能力。訓練完成後,該模型在四個粵語基準測試中達到了最先進的(SOTA)性能。在我們的數據集上訓練後,該模型在其他主流語言任務上也表現出改進的性能。