WikiEdge:ArXiv速遞/2025-05-23

出自WikiEdge
於 2025年5月26日 (一) 13:19 由 Carole留言 | 貢獻 所做的修訂 (Updated page by Carole)
跳至導覽 跳至搜尋

摘要

  • 原文標題:Gradient-Based Program Repair: Fixing Bugs in Continuous Program Spaces
  • 中文標題:基於梯度的程序修復:在連續程序空間中修復錯誤
  • 發布日期:2025-05-23 10:12:09+00:00
  • 作者:André Silva, Gustav Thorén, Martin Monperrus
  • 分類:cs.PL, cs.LG, cs.SE
  • 原文連結http://arxiv.org/abs/2505.17703v1

中文摘要自動程序修復旨在從有缺陷的程序中生成正確代碼,現有方法大多在原始碼符號標記的離散空間中進行正確程序搜索。這種符號搜索的根本局限在於無法直接推理程序行為。我們提出基於梯度程序修復(GBPR),該新範式將程序修復重構為可微分數值程序空間中的連續優化問題。核心思路是將符號程序編譯為可微分數值表示,從而直接在數值程序空間中基於程序行為指導搜索。為評估GBPR,我們構建了RaspBugs基準集——包含1,466個有缺陷的符號RASP程序及其對應數值表示。實驗表明,GBPR能通過在數值程序空間中進行梯度優化有效修復符號程序,並呈現可信的修復軌跡。據我們所知,這是首次將程序修復表述為數值程序空間中的連續優化問題。本研究為程序修復開闢了新方向,連接了兩個豐富領域:連續優化程序行為

摘要

  • 原文標題:Minimax Rate-Optimal Algorithms for High-Dimensional Stochastic Linear Bandits
  • 中文標題:高維隨機線性老虎機問題的最小最大率最優算法
  • 發布日期:2025-05-23 02:20:00+00:00
  • 作者:Jingyu Liu, Yanglei Song
  • 分類:math.ST, stat.ML, stat.TH
  • 原文連結http://arxiv.org/abs/2505.17400v1

中文摘要:摘要:我們研究了具有多個臂的隨機線性老虎機問題,該問題跨越T輪次,其中協變量維度d可能超過T,但每個臂特定的參數向量s-稀疏的。我們首先分析了單臂設置下的序列估計問題,重點關注累積均方誤差。研究表明,Lasso估計器在序列設置中具有可證明的次優性,表現出對d和T的次優依賴,而閾值Lasso估計器——通過將最小二乘法應用於由初始Lasso估計器閾值選擇支持集獲得——達到了極小極大率。基於這些見解,我們考慮了完整的線性上下文老虎機問題,並提出了一種三階段臂選擇算法,該算法使用閾值Lasso作為主要估計方法。我們推導出階數為s(log s)(log d + log T)的累積遺憾上界,並建立了一個匹配的下界,最多相差一個log s因子,從而將極小極大遺憾率刻畫到s的對數項。此外,當從遺憾中排除一個短的初始周期時,所提出的算法實現了精確的極小極大最優性