WikiEdge:ArXiv速递/2025-03-13:修订间差异
Updated page by Carole |
Updated page by Carole |
||
第16行: | 第16行: | ||
*'''原文链接''':http://arxiv.org/abs/2503.10192v1 | *'''原文链接''':http://arxiv.org/abs/2503.10192v1 | ||
'''中文摘要''':摘要:[[AI]]领导权的争夺战正在进行,[[美国]]的[[OpenAI]]和[[中国]]的[[DeepSeek]]是主要竞争者。针对这些全球趋势,[[西班牙]]政府提出了[[ALIA]],这是一个公开透明的[[AI基础设施]],包含了支持[[西班牙语]]及[[巴斯克语]]等官方语言的[[小型语言模型]]。本文展示了[[红队测试]]的结果,十名参与者运用他们的专业知识和创造力,手动测试了这些倡议中的三个最新模型——[[OpenAI o3-mini]]、[[DeepSeek R1]]和[[ALIA Salamandra]]——重点关注[[偏见]]和[[安全]]问题。基于670次对话的结果显示,所有测试模型都存在漏洞,偏见或不安全的回应比例从o3-mini的29.5%到Salamandra的50.6%不等。这些发现凸显了开发可靠且值得信赖的[[AI系统]],特别是那些旨在支持[[西班牙语]]和[[巴斯克语]]的系统,所面临的持续挑战。 | '''中文摘要''':摘要:[[AI]]领导权的争夺战正在进行,[[美国]]的[[OpenAI]]和[[中国]]的[[DeepSeek]]是主要竞争者。针对这些全球趋势,[[西班牙]]政府提出了[[ALIA]],这是一个公开透明的[[AI基础设施]],包含了支持[[西班牙语]]及[[巴斯克语]]等官方语言的[[小型语言模型]]。本文展示了[[红队测试]]的结果,十名参与者运用他们的专业知识和创造力,手动测试了这些倡议中的三个最新模型——[[OpenAI o3-mini]]、[[DeepSeek R1]]和[[ALIA Salamandra]]——重点关注[[偏见]]和[[安全]]问题。基于670次对话的结果显示,所有测试模型都存在漏洞,偏见或不安全的回应比例从o3-mini的29.5%到Salamandra的50.6%不等。这些发现凸显了开发可靠且值得信赖的[[AI系统]],特别是那些旨在支持[[西班牙语]]和[[巴斯克语]]的系统,所面临的持续挑战。 | ||
== 摘要 == | |||
* '''原文标题''':Bayesian analysis of a (3+1)D hybrid approach with initial conditions from hadronic transport | |||
* '''中文标题''':基于强子输运初始条件的(3+1)D混合方法的贝叶斯分析 | |||
* '''发布日期''':2025-03-13 09:09:20+00:00 | |||
* '''作者''':Niklas Götz, Iurii Karpenko, Hannah Elfner | |||
* '''分类''':nucl-th, hep-ph, nucl-ex | |||
*'''原文链接''':http://arxiv.org/abs/2503.10181v1 | |||
'''中文摘要''':本研究旨在将[[统计学习]],特别是[[贝叶斯推断]],应用于(3+1)D [[SMASH-vHLLE]]混合模型,使用由[[SMASH]]输运代码本身生成的初始条件,目的是约束模型参数并更深入地了解[[剪切粘度]]和[[体积粘度]]对[[温度]]和[[重子化学势]]的依赖性。该研究在[[SMASH-vHLLE]]混合方法中进行,该方法由[[强子输运]]方法[[SMASH]]和(3+1)D [[粘性流体动力学]]代码[[vHLLE]]组成。采用[[贝叶斯框架]],利用[[马尔可夫链蒙特卡罗]]([[MCMC]])采样来探索[[参数空间]]。分析将模型预测与实验观测值进行比较,包括[[粒子产额]]、[[动量]]和[[流系数]],无论是在[[中快度区]]还是在前向和后向方向。我们发现,使用不同[[束流能量]]下[[Au+Au碰撞]]的[[强子初始条件]],[[SMASH-vHLLE]]混合框架可以重现[[中快度区]]和[[前向/后向快度区]]的多种实验观测值。值得注意的是,优选的[[后验分布]]表明,在高温[[QGP相]]中,特定[[剪切粘度]]几乎消失,而在[[相变区域]]附近,[[体积粘度]]从中等到较大,尽管对[[重子化学势]]依赖性的约束较弱。我们的研究结果表明,[[强子初始条件]]在中等能量下更严格地约束了演化,使得[[流体动力学起始时间]]等参数高度敏感。有趣的是,提取的[[剪切粘度]]与之前的[[贝叶斯分析]]有显著差异,这促使我们进一步进行系统研究,使用更高统计量的数据集和更精细的建模假设。 |
2025年3月14日 (五) 09:53的版本
摘要
- 原文标题:References to unbiased sources increase the helpfulness of community fact-checks
- 中文标题:引用无偏见来源提高社区事实核查的有用性
- 发布日期:2025-03-13 17:12:01+00:00
- 作者:Kirill Solovev, Nicolas Pröllochs
- 分类:cs.SI
- 原文链接:http://arxiv.org/abs/2503.10560v1
中文摘要:基于社区的事实核查是一种有前景的方法,可以大规模应对社交媒体上的错误信息。然而,对于什么使社区创建的事实核查对用户有帮助的理解仍处于初级阶段。在本文中,我们分析了社区创建的事实核查的有用性决定因素。为此,我们利用了一个独特的数据集,该数据集包含来自X(前身为Twitter)社区笔记平台的真实社区创建的事实核查和有用性评分。我们的实证分析表明,基于社区的事实核查中,有用性的关键决定因素是用户是否提供了外部来源的链接来支持他们的断言。平均而言,如果社区创建的事实核查提供了外部来源的链接,其被感知为有用的几率高出2.70倍。此外,我们证明了社区创建的事实核查的有用性因其政治偏见水平而异。我们发现,链接到高偏见来源(无论来自哪一政治派别)的社区创建的事实核查被认为显著不那么有用。这表明社区笔记平台上的评分机制成功地惩罚了一边倒和政治动机的推理。这些发现对社交媒体平台具有重要意义,它们可以利用我们的结果来优化其基于社区的事实核查系统。
摘要
- 原文标题:Red Teaming Contemporary AI Models: Insights from Spanish and Basque Perspectives
- 中文标题:当代AI模型的红队测试:来自西班牙和巴斯克视角的见解
- 发布日期:2025-03-13 09:27:24+00:00
- 作者:Miguel Romero-Arjona, Pablo Valle, Juan C. Alonso, Ana B. Sánchez, Miriam Ugarte, Antonia Cazalilla, Vicente Cambrón, José A. Parejo, Aitor Arrieta, Sergio Segura
- 分类:cs.SE, cs.CL
- 原文链接:http://arxiv.org/abs/2503.10192v1
中文摘要:摘要:AI领导权的争夺战正在进行,美国的OpenAI和中国的DeepSeek是主要竞争者。针对这些全球趋势,西班牙政府提出了ALIA,这是一个公开透明的AI基础设施,包含了支持西班牙语及巴斯克语等官方语言的小型语言模型。本文展示了红队测试的结果,十名参与者运用他们的专业知识和创造力,手动测试了这些倡议中的三个最新模型——OpenAI o3-mini、DeepSeek R1和ALIA Salamandra——重点关注偏见和安全问题。基于670次对话的结果显示,所有测试模型都存在漏洞,偏见或不安全的回应比例从o3-mini的29.5%到Salamandra的50.6%不等。这些发现凸显了开发可靠且值得信赖的AI系统,特别是那些旨在支持西班牙语和巴斯克语的系统,所面临的持续挑战。
摘要
- 原文标题:Bayesian analysis of a (3+1)D hybrid approach with initial conditions from hadronic transport
- 中文标题:基于强子输运初始条件的(3+1)D混合方法的贝叶斯分析
- 发布日期:2025-03-13 09:09:20+00:00
- 作者:Niklas Götz, Iurii Karpenko, Hannah Elfner
- 分类:nucl-th, hep-ph, nucl-ex
- 原文链接:http://arxiv.org/abs/2503.10181v1
中文摘要:本研究旨在将统计学习,特别是贝叶斯推断,应用于(3+1)D SMASH-vHLLE混合模型,使用由SMASH输运代码本身生成的初始条件,目的是约束模型参数并更深入地了解剪切粘度和体积粘度对温度和重子化学势的依赖性。该研究在SMASH-vHLLE混合方法中进行,该方法由强子输运方法SMASH和(3+1)D 粘性流体动力学代码vHLLE组成。采用贝叶斯框架,利用马尔可夫链蒙特卡罗(MCMC)采样来探索参数空间。分析将模型预测与实验观测值进行比较,包括粒子产额、动量和流系数,无论是在中快度区还是在前向和后向方向。我们发现,使用不同束流能量下Au+Au碰撞的强子初始条件,SMASH-vHLLE混合框架可以重现中快度区和前向/后向快度区的多种实验观测值。值得注意的是,优选的后验分布表明,在高温QGP相中,特定剪切粘度几乎消失,而在相变区域附近,体积粘度从中等到较大,尽管对重子化学势依赖性的约束较弱。我们的研究结果表明,强子初始条件在中等能量下更严格地约束了演化,使得流体动力学起始时间等参数高度敏感。有趣的是,提取的剪切粘度与之前的贝叶斯分析有显著差异,这促使我们进一步进行系统研究,使用更高统计量的数据集和更精细的建模假设。