WikiEdge:ArXiv速递/2025-03-13

来自WikiEdge
Carole留言 | 贡献2025年3月14日 (五) 09:53的版本 (Updated page by Carole)
跳转到导航 跳转到搜索

摘要

  • 原文标题:References to unbiased sources increase the helpfulness of community fact-checks
  • 中文标题:引用无偏见来源提高社区事实核查的有用性
  • 发布日期:2025-03-13 17:12:01+00:00
  • 作者:Kirill Solovev, Nicolas Pröllochs
  • 分类:cs.SI
  • 原文链接http://arxiv.org/abs/2503.10560v1

中文摘要:基于社区事实核查是一种有前景的方法,可以大规模应对社交媒体上的错误信息。然而,对于什么使社区创建的事实核查对用户有帮助的理解仍处于初级阶段。在本文中,我们分析了社区创建的事实核查的有用性决定因素。为此,我们利用了一个独特的数据集,该数据集包含来自X(前身为Twitter)社区笔记平台的真实社区创建的事实核查和有用性评分。我们的实证分析表明,基于社区的事实核查中,有用性的关键决定因素是用户是否提供了外部来源的链接来支持他们的断言。平均而言,如果社区创建的事实核查提供了外部来源的链接,其被感知为有用的几率高出2.70倍。此外,我们证明了社区创建的事实核查的有用性因其政治偏见水平而异。我们发现,链接到高偏见来源(无论来自哪一政治派别)的社区创建的事实核查被认为显著不那么有用。这表明社区笔记平台上的评分机制成功地惩罚了一边倒和政治动机的推理。这些发现对社交媒体平台具有重要意义,它们可以利用我们的结果来优化其基于社区的事实核查系统。

摘要

  • 原文标题:Red Teaming Contemporary AI Models: Insights from Spanish and Basque Perspectives
  • 中文标题:当代AI模型的红队测试:来自西班牙和巴斯克视角的见解
  • 发布日期:2025-03-13 09:27:24+00:00
  • 作者:Miguel Romero-Arjona, Pablo Valle, Juan C. Alonso, Ana B. Sánchez, Miriam Ugarte, Antonia Cazalilla, Vicente Cambrón, José A. Parejo, Aitor Arrieta, Sergio Segura
  • 分类:cs.SE, cs.CL
  • 原文链接http://arxiv.org/abs/2503.10192v1

中文摘要:摘要:AI领导权的争夺战正在进行,美国OpenAI中国DeepSeek是主要竞争者。针对这些全球趋势,西班牙政府提出了ALIA,这是一个公开透明的AI基础设施,包含了支持西班牙语巴斯克语等官方语言的小型语言模型。本文展示了红队测试的结果,十名参与者运用他们的专业知识和创造力,手动测试了这些倡议中的三个最新模型——OpenAI o3-miniDeepSeek R1ALIA Salamandra——重点关注偏见安全问题。基于670次对话的结果显示,所有测试模型都存在漏洞,偏见或不安全的回应比例从o3-mini的29.5%到Salamandra的50.6%不等。这些发现凸显了开发可靠且值得信赖的AI系统,特别是那些旨在支持西班牙语巴斯克语的系统,所面临的持续挑战。

摘要

  • 原文标题:Bayesian analysis of a (3+1)D hybrid approach with initial conditions from hadronic transport
  • 中文标题:基于强子输运初始条件的(3+1)D混合方法的贝叶斯分析
  • 发布日期:2025-03-13 09:09:20+00:00
  • 作者:Niklas Götz, Iurii Karpenko, Hannah Elfner
  • 分类:nucl-th, hep-ph, nucl-ex
  • 原文链接http://arxiv.org/abs/2503.10181v1

中文摘要:本研究旨在将统计学习,特别是贝叶斯推断,应用于(3+1)D SMASH-vHLLE混合模型,使用由SMASH输运代码本身生成的初始条件,目的是约束模型参数并更深入地了解剪切粘度体积粘度温度重子化学势的依赖性。该研究在SMASH-vHLLE混合方法中进行,该方法由强子输运方法SMASH和(3+1)D 粘性流体动力学代码vHLLE组成。采用贝叶斯框架,利用马尔可夫链蒙特卡罗MCMC)采样来探索参数空间。分析将模型预测与实验观测值进行比较,包括粒子产额动量流系数,无论是在中快度区还是在前向和后向方向。我们发现,使用不同束流能量Au+Au碰撞强子初始条件SMASH-vHLLE混合框架可以重现中快度区前向/后向快度区的多种实验观测值。值得注意的是,优选的后验分布表明,在高温QGP相中,特定剪切粘度几乎消失,而在相变区域附近,体积粘度从中等到较大,尽管对重子化学势依赖性的约束较弱。我们的研究结果表明,强子初始条件在中等能量下更严格地约束了演化,使得流体动力学起始时间等参数高度敏感。有趣的是,提取的剪切粘度与之前的贝叶斯分析有显著差异,这促使我们进一步进行系统研究,使用更高统计量的数据集和更精细的建模假设。