查看“WikiEdge:ArXiv速递/2025-03-05”的源代码
←
WikiEdge:ArXiv速递/2025-03-05
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
== 摘要 == * '''原文标题''':First Limits on Light Dark Matter Interactions in a Low Threshold Two Channel Athermal Phonon Detector from the TESSERACT Collaboration * '''中文标题''':TESSERACT合作组在低阈值双通道非热声子探测器中首次对轻暗物质相互作用的限制 * '''发布日期''':2025-03-05 17:22:53+00:00 * '''作者''':C. L. Chang, Y. -Y. Chang, L. Chaplinsky, C. W. Fink, M. Garcia-Sciveres, W. Guo, S. A. Hertel, X. Li, J. Lin, M. Lisovenko, R. Mahapatra, W. Matava, D. N. McKinsey, V. Novati, P. K. Patel, B. Penning, H. D. Pinckney, M. Platt, M. Pyle, Y. Qi, M. Reed, G. R. C Rischbieter, R. K. Romani, B. Sadoulet, B. Serfass, P. Sorensen, A. Suzuki, V. Velan, G. Wang, Y. Wang, S. L. Watkins, M. R. Williams, J. K. Wuko, T. Aramaki, P. Cushman, N. N. Gite, A. Gupta, M. E. Huber, N. A. Kurinsky, J. S. Mammo, A. J. Mayer, J. Nelson, S. M. Oser, L. Pandey, A. Pradeep, W. Rau, T. Saab * '''分类''':hep-ex, physics.ins-det *'''原文链接''':http://arxiv.org/abs/2503.03683v1 '''中文摘要''':我们展示了在地面运行的1 cm² × 1 mm厚(0.233克)高分辨率[[硅]]非热声子探测器中,对自旋无关的[[暗物质]]-核子相互作用的搜索结果。该传感器实现了σ_P = 361.5(4)毫电子伏特的能量分辨率,这是迄今为止任何非热声子探测器的最佳分辨率。通过0.233克 × 12小时的曝光量,我们对44至87兆电子伏特/平方c之间的暗物质质量设定了最严格的限制,最低未探索的截面为4e-32平方厘米,对应87兆电子伏特/平方c。我们采用了一种保守的盐化技术,达到了迄今为止通过直接探测实验探测到的最低暗物质质量。这一限制是通过双通道抑制与单个传感器耦合的低能背景实现的。 == 摘要 == * '''原文标题''':Towards Understanding Distilled Reasoning Models: A Representational Approach * '''中文标题''':理解蒸馏推理模型:一种表征方法 * '''发布日期''':2025-03-05 18:40:19+00:00 * '''作者''':David D. Baek, Max Tegmark * '''分类''':cs.LG *'''原文链接''':http://arxiv.org/abs/2503.03730v1 '''中文摘要''':在本文中,我们研究了[[模型蒸馏]]如何影响[[大型语言模型]](LLMs)中[[推理]]特征的发展。为了探索这一点,我们在[[Qwen系列模型]]及其[[微调]]变体上训练了一个[[跨编码器]]。我们的结果表明,跨编码器学习了与各种推理类型相对应的特征,包括[[自我反思]]和[[计算验证]]。此外,我们观察到[[蒸馏模型]]包含独特的推理特征方向,这些方向可用于引导模型进入[[过度思考]]或[[敏锐思考]]模式。特别是,我们对四种特定的推理类别进行了分析:(a)[[自我反思]],(b)[[演绎推理]],(c)[[替代推理]],以及(d)[[对比推理]]。最后,我们研究了[[蒸馏过程]]导致的特征几何变化,并发现较大的蒸馏模型可能会发展出更具结构化的表示,这与增强的蒸馏性能相关。通过提供关于蒸馏如何修改模型的见解,我们的研究有助于提高[[AI系统]]的[[透明度]]和[[可靠性]]。 == 摘要 == * '''原文标题''':Active 6D Pose Estimation for Textureless Objects using Multi-View RGB Frames * '''中文标题''':使用多视角RGB帧进行无纹理物体的主动6D姿态估计 * '''发布日期''':2025-03-05 18:28:32+00:00 * '''作者''':Jun Yang, Wenjie Xue, Sahar Ghavidel, Steven L. Waslander * '''分类''':cs.CV, cs.RO *'''原文链接''':http://arxiv.org/abs/2503.03726v1 '''中文摘要''':从[[RGB图像]]中估计无纹理物体的[[6D姿态]]是[[机器人学]]中的一个重要问题。由于外观模糊性、旋转对称性和严重遮挡,基于单视图的6D姿态估计器仍然无法处理广泛的物体,这促使了[[多视图姿态估计]]和[[最佳视角预测]]的研究,以解决这些限制。在这项工作中,我们提出了一个全面的[[主动感知]]框架,仅使用RGB图像来估计无纹理物体的6D姿态。我们的方法基于一个关键思想:将6D姿态估计解耦为一个顺序的两步过程可以显著提高准确性和效率。首先,我们估计每个物体的[[3D平移]],解决RGB图像固有的尺度和深度模糊性。然后,这些估计用于简化后续的[[3D方向]]确定任务,我们通过[[规范尺度模板匹配]]来实现。基于这一公式,我们进一步引入了一种主动感知策略,预测下一个最佳[[相机视角]]以捕捉RGB图像,有效减少物体姿态的不确定性并提高姿态准确性。我们在公开的[[ROBI数据集]]以及我们自己创建的[[透明物体数据集]]上评估了我们的方法。在使用相同相机视角进行评估时,我们的多视图姿态估计显著优于最先进的方法。此外,通过利用我们的最佳视角策略,我们的方法在比基于启发式策略更少的视角下实现了高物体姿态准确性。 == 摘要 == * '''原文标题''':Exploring Dual-Iron Atomic Catalysts for Efficient Nitrogen Reduction: A Comprehensive Study on Structural and Electronic Optimization * '''中文标题''':探索双铁原子催化剂用于高效氮还原:结构与电子优化的综合研究 * '''发布日期''':2025-03-05 12:00:44+00:00 * '''作者''':Zhe Zhang, Wenxin Ma, Jiajie Qiao, Xiaoliang Wu, Shaowen Yu, Weiye Hou, Xiang Huang, Rubin Huo, Hongbo Wu, Yusong Tu * '''分类''':cond-mat.mtrl-sci, physics.chem-ph *'''原文链接''':http://arxiv.org/abs/2503.03427v1 '''中文摘要''':[[氮还原反应]](NRR)作为一种高效且绿色的[[氨合成]]途径,在实现按需氨生产中起着至关重要的作用。本研究提出了一种基于双铁原子位点和[[氮硼共掺杂石墨烯]]催化剂的新设计理念,探索其在NRR中的高效性。通过调节N和B的共掺杂比例,我们发现Fe2N3B@G催化剂在N2分子的吸附和氢化中表现出显著的活性,尤其是在NRR远端路径上具有最低的自由能(0.32 eV),显示出其优异的氮活化能力和NRR性能。计算的[[电子局域化函数]]、[[晶体轨道哈密顿布居]]、[[静电势图]]揭示了Fe2N3B@G催化剂改进的NRR动力学源于N3B共掺杂诱导的Fe-Fe电子环境优化、Fe-N键强度的调节以及N2断裂和氢化过程中的持续电子支持。特别是,[[机器学习分子动力学]](MLMD)模拟被用来验证Fe2N3B@G催化剂在NRR中的高活性,结果表明Fe2N3B@G有效调节了Fe-N键的电子密度,确保了NH3分子的顺利生成和解吸,并避免了与[[析氢反应]](HER)的竞争。此外,Fe2N3B@G催化剂确定的较高HER过电位可以有效抑制HER并增强对NRR的选择性。此外,Fe2N3B@G催化剂在高达500 K的[[分子动力学模拟]]中也表现出良好的热稳定性,为其在实际应用中的可行性提供了支持。本研究展示了Fe2N3B@G在氮还原催化中的优越性能,并通过共掺杂策略和深入的电子环境调节为原子催化剂设计提供了理论指导。 == 摘要 == * '''原文标题''':A Multimodal Framework for Topic Propagation Classification in Social Networks * '''中文标题''':社交网络中话题传播分类的多模态框架 * '''发布日期''':2025-03-05 02:12:23+00:00 * '''作者''':Yuchuan Jiang, Chaolong Jia, Yunyi Qin, Wei Cai, Yongsen Qian * '''分类''':cs.SI, cs.AI, cs.NE *'''原文链接''':http://arxiv.org/abs/2503.03112v1 '''中文摘要''':[[互联网]]的快速发展和[[社交网络]]的广泛采用显著加速了[[信息传播]]。然而,这种转变也带来了[[信息捕获]]和[[信息处理]]的复杂性,给研究人员和实践者带来了巨大挑战。因此,预测社交网络中与主题相关的信息传播已成为一个关键的研究焦点。本文通过整合从关键传播特征中提取的多维特征,提出了一种用于社交网络中主题传播的预测模型。具体而言,我们在[[PageRank算法]]中引入了两个新指标——[[用户关系广度]]和[[用户权威性]],以更有效地量化[[用户影响力]]。此外,我们采用[[Text-CNN模型]]进行[[情感分类]],从文本内容中提取[[情感特征]]。节点的时序嵌入通过[[Bi-LSTM模型]]进行编码,以捕捉时序动态。此外,我们改进了用户与主题交互痕迹的测量方法,用更精确的传播特征度量替代了传统的[[主题浏览量]]指标。最后,我们使用[[Transformer模型]]整合提取的多维特征,显著提升了预测性能。实验结果表明,我们提出的模型在[[FI-Score]]、[[AUC]]和[[Recall]]方面优于传统的[[机器学习]]和[[单模态深度学习]]模型,验证了其在预测社交网络中主题传播方面的有效性。 == 摘要 == * '''原文标题''':Improving LLM Safety Alignment with Dual-Objective Optimization * '''中文标题''':通过双目标优化改进大语言模型的安全对齐 * '''发布日期''':2025-03-05 18:01:05+00:00 * '''作者''':Xuandong Zhao, Will Cai, Tianneng Shi, David Huang, Licong Lin, Song Mei, Dawn Song * '''分类''':cs.CL, cs.CR, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.03710v1 '''中文摘要''':现有的大型语言模型([[LLMs]])训练时安全对齐技术在面对[[越狱攻击]]时仍然脆弱。[[直接偏好优化]]([[DPO]])作为一种广泛部署的对齐方法,在实验和理论背景下都表现出局限性,因为其损失函数在[[拒绝学习]]方面被证明是次优的。通过基于梯度的分析,我们识别了这些不足,并提出了一种改进的安全对齐方法,将[[DPO]]目标分解为两个部分:(1)鲁棒的拒绝训练,即使在生成部分不安全内容时也鼓励拒绝;(2)有针对性地遗忘有害知识。这种方法显著提高了[[LLM]]在面对各种[[越狱攻击]]时的鲁棒性,包括[[预填充]]、[[后缀]]和[[多轮攻击]],涵盖[[分布内]]和[[分布外]]场景。此外,我们引入了一种方法,通过结合基于奖励的令牌级加权机制来强调关键的拒绝令牌,从而进一步提高对抗性攻击的鲁棒性。我们的研究还表明,对[[越狱攻击]]的鲁棒性与训练过程中令牌分布的偏移以及拒绝和有害令牌的内部表示相关,为未来[[LLM]]安全对齐研究提供了有价值的方向。代码可在https://github.com/wicai24/DOOR-Alignment获取。 == 摘要 == * '''原文标题''':Fast and Precise Spectral Analysis for Dark Matter Searches with LIGO * '''中文标题''':快速精确的频谱分析用于LIGO暗物质搜索 * '''发布日期''':2025-03-05 09:18:14+00:00 * '''作者''':Alexandre Göttel, Vivien Raymond * '''分类''':astro-ph.CO, gr-qc *'''原文链接''':http://arxiv.org/abs/2503.03293v1 '''中文摘要''':我们引入了一种新颖的[[对数谱估计]]方法,用于利用[[引力波探测器]]进行[[暗物质]]搜索,将已建立的[[暗物质搜索技术]]与[[计算机音乐分析]]的见解相结合。通过利用[[时域]]和[[频域]]之间的对称性,该方法在[[计算效率]]上与基于[[FFT]]的算法相当,但不像这些算法那样牺牲[[精度]]。我们将这种方法应用于[[LIGO]]第三次观测运行的数据,直接将其性能与之前的搜索进行比较。我们的结果显示,在几乎整个[[频率范围]]内,性能一致提高了15%,且无需额外的[[计算成本]]。随着进一步改进的潜力,该方法已经提供了一种能够最大化当前和未来[[引力波观测站]]科学潜力的解决方案。 == 摘要 == * '''原文标题''':Nanocavity-Enhanced Second-Harmonic Generation from Colossal Quantum Dots * '''中文标题''':纳米腔增强的巨量子点二次谐波产生 * '''发布日期''':2025-03-05 00:22:01+00:00 * '''作者''':David Sharp, Abhinav Kala, Hannah Rarick, Hao A. Nguyen, Elise Skytte, Brandi M. Cossairt, Arka Majumdar * '''分类''':physics.optics, physics.app-ph *'''原文链接''':http://arxiv.org/abs/2503.03072v1 '''中文摘要''':[[胶体量子点]](QDs)是[[非线性光学]]和与[[光子器件]]确定性异质集成的有吸引力的介质。通过将[[量子点]]耦合到低模体积的[[光子纳米腔]]中,可以进一步增强其固有的非线性特性,从而实现低功耗的[[片上非线性光学]]。在本文中,我们通过将[[巨型量子点]]与[[氮化硅]]纳米束腔集成,展示了腔增强的[[二次谐波产生]]。通过使用[[超快脉冲激光]]泵浦腔-量子点系统,我们观察到腔耦合量子点产生了强烈的二次谐波,并估计增强因子约为3,040。我们的工作,结合之前报道的巨型量子点的确定性定位,可以为低功耗非线性光学提供一个可扩展的量子点-腔平台。 == 摘要 == * '''原文标题''':Sublinear Data Structures for Nearest Neighbor in Ultra High Dimensions * '''中文标题''':超维空间中最近邻的次线性数据结构 * '''发布日期''':2025-03-05 00:37:39+00:00 * '''作者''':Martin G. Herold, Danupon Nanongkai, Joachim Spoerhase, Nithin Varma, Zihang Wu * '''分类''':cs.DS, cs.CG *'''原文链接''':http://arxiv.org/abs/2503.03079v1 '''中文摘要''':[[几何数据结构]]在维度远小于输入点数量的情况下得到了广泛研究。然而,在[[机器学习]]的许多场景中,维度可能远高于点的数量,甚至高到数据结构无法读取和存储输入点和查询点的所有坐标。受这些场景以及[[特征选择]]和[[可解释聚类]]相关研究的启发,我们开始研究这种超高维情况下的几何数据结构。我们的重点是**[[近似最近邻]]**问题。在该问题中,给定一组$n$个点$C\subseteq \mathbb{R}^d$,需要生成一个**小型**数据结构,能够**快速**回答以下查询:给定$q\in \mathbb{R}^d$,返回一个近似最近的点$c\in C$。本文的主要问题是:**当$d\gg n$时,是否存在具有次线性($o(nd)$)空间和次线性($o(d)$)查询时间的数据结构?** 在本文中,我们肯定地回答了这个问题。我们提出了$(1+\epsilon)$-近似数据结构,并给出了以下保证。对于$\ell_1$-和$\ell_2$-范数距离:$\tilde O(n \log(d)/\mathrm{poly}(\epsilon))$空间和$\tilde O(n/\mathrm{poly}(\epsilon))$查询时间。我们证明了这些空间和时间界限在$\mathrm{poly}{(\log n/\epsilon)}$因子内是紧的。对于$\ell_p$-范数距离:$\tilde O(n^2 \log(d) (\log\log (n)/\epsilon)^p)$空间和$\tilde O\left(n(\log\log (n)/\epsilon)^p\right)$查询时间。通过简单的归约,我们的数据结构暗示了其他一些几何问题的次线性-$d$数据结构;例如,[[近似正交范围搜索]]、[[最远邻]],并产生了$k$-[[中位数]]和$k$-[[均值聚类]]的次线性$O(1)$-近似表示。 == 摘要 == * '''原文标题''':OTTER: A Vision-Language-Action Model with Text-Aware Visual Feature Extraction * '''中文标题''':OTTER:一种具有文本感知视觉特征提取的视觉-语言-动作模型 * '''发布日期''':2025-03-05 18:44:48+00:00 * '''作者''':Huang Huang, Fangchen Liu, Letian Fu, Tingfan Wu, Mustafa Mukadam, Jitendra Malik, Ken Goldberg, Pieter Abbeel * '''分类''':cs.RO, cs.CV *'''原文链接''':http://arxiv.org/abs/2503.03734v1 '''中文摘要''':[[视觉-语言-动作]](VLA)模型旨在基于[[视觉观察]]和[[语言指令]]预测[[机器人动作]]。现有方法需要微调预训练的[[视觉-语言模型]](VLM),因为视觉和语言特征是独立输入到下游策略中的,这会降低预训练的语义对齐效果。我们提出了[[OTTER]],一种新颖的VLA架构,通过显式的、文本感知的视觉特征提取来利用这些现有的对齐。OTTER不是处理所有视觉特征,而是选择性地提取并仅传递与语言指令语义对齐的任务相关视觉特征到[[策略变换器]]中。这使得OTTER能够保持预训练的视觉-语言编码器冻结。因此,OTTER保留并利用了从大规模预训练中学到的丰富语义理解,实现了强大的[[零样本泛化]]能力。在[[仿真]]和[[真实世界]]实验中,OTTER显著优于现有的VLA模型,展示了对新物体和环境的强大零样本泛化能力。视频、代码、检查点和数据集:https://ottervla.github.io/。 == 摘要 == * '''原文标题''':Towards Trustworthy Federated Learning * '''中文标题''':迈向可信的联邦学习 * '''发布日期''':2025-03-05 17:25:20+00:00 * '''作者''':Alina Basharat, Yijun Bian, Ping Xu, Zhi Tian * '''分类''':cs.LG, cs.CR, cs.DC *'''原文链接''':http://arxiv.org/abs/2503.03684v1 '''中文摘要''':本文开发了一个综合框架,以解决[[联邦学习]](FL)中的三个关键可信挑战:对抗[[拜占庭攻击]]的[[鲁棒性]]、[[公平性]]和[[隐私保护]]。为了提高系统对抗发送恶意信息以偏置系统性能的拜占庭攻击的防御能力,我们开发了一种基于双面范数的筛选机制(TNBS),该机制允许中央服务器裁剪具有最低范数l和最高范数h的梯度。TNBS作为一种筛选工具,用于过滤掉那些梯度与诚实参与者相差甚远的潜在恶意参与者。为了促进平等公平性,我们采用了q-公平联邦学习(q-FFL)。此外,我们采用了一种基于[[差分隐私]]的方案,以防止本地客户端的原始数据被好奇方推断。我们为所提出的框架在不同场景下提供了[[收敛保证]]。在真实数据集上的实验结果表明,所提出的框架在管理隐私与准确性之间的权衡的同时,有效地提高了鲁棒性和公平性。这项工作似乎是第一个在实验和理论上同时解决可信FL中公平性、隐私和鲁棒性的研究。 == 摘要 == * '''原文标题''':Effective LLM Knowledge Learning via Model Generalization * '''中文标题''':通过模型泛化实现有效的LLM知识学习 * '''发布日期''':2025-03-05 17:56:20+00:00 * '''作者''':Mingkang Zhu, Xi Chen, Zhongdao Wang, Bei Yu, Hengshuang Zhao, Jiaya Jia * '''分类''':cs.CL, cs.LG *'''原文链接''':http://arxiv.org/abs/2503.03705v1 '''中文摘要''':[[大型语言模型]](LLMs)在包含广泛[[世界知识]]的海量文档上进行训练。然而,通过[[自回归预训练]]如何获取知识仍然没有得到很好的理解。这种理解的缺乏极大地阻碍了有效的知识学习,特别是在对最新信息进行持续预训练时,因为这些不断变化的信息通常缺乏像[[基础知识]]那样的多样化重复。在本文中,我们专注于理解和改进LLM的知识学习。我们发现并验证了LLM的知识学习可以被视为隐藏在自回归预训练目标中的隐式[[监督任务]]。我们的研究结果表明,LLM的知识学习将受益于旨在提高监督任务[[泛化能力]]的方法。基于我们的分析,我们提出了基于[[格式化]]的[[数据增强]]方法,以增加[[分布内样本]],这种方法不会像[[文本改写]]那样改变文档中嵌入的事实。我们还引入了[[锐度感知最小化]]作为一种有效的[[优化算法]],以更好地提高泛化能力。此外,我们的分析和方法可以轻松扩展到[[指令微调]]。大量的实验结果验证了我们的发现,并展示了我们的方法在持续预训练和指令微调中的有效性。本文为解释和设计LLM知识学习的有效策略提供了新的视角和见解。 == 摘要 == * '''原文标题''':DualDiff+: Dual-Branch Diffusion for High-Fidelity Video Generation with Reward Guidance * '''中文标题''':DualDiff+:基于奖励引导的双分支扩散模型用于高保真视频生成 * '''发布日期''':2025-03-05 17:31:45+00:00 * '''作者''':Zhao Yang, Zezhong Qian, Xiaofan Li, Weixiang Xu, Gongpeng Zhao, Ruohong Yu, Lingsi Zhu, Longjun Liu * '''分类''':cs.CV *'''原文链接''':http://arxiv.org/abs/2503.03689v1 '''中文摘要''':准确且高保真的[[驾驶场景]]重建需要有效利用全面的场景信息作为条件输入。现有方法主要依赖于[[3D边界框]]和[[BEV道路地图]]进行前景和背景控制,这些方法无法捕捉驾驶场景的全部复杂性,也无法充分整合[[多模态信息]]。在这项工作中,我们提出了[[DualDiff]],一种双分支条件[[扩散模型]],旨在增强多视图和视频序列中的驾驶场景生成。具体来说,我们引入了[[占用射线形状采样]](ORS)作为条件输入,提供了丰富的前景和背景语义以及[[3D空间几何信息]],以精确控制两者的生成。为了改善细粒度前景对象(特别是复杂和远距离对象)的合成,我们提出了一种[[前景感知掩码]](FGM)去噪损失函数。此外,我们开发了[[语义融合注意力]](SFA)机制,以动态优先处理相关信息并抑制噪声,从而实现更有效的多模态融合。最后,为了确保高质量的图像到视频生成,我们引入了[[奖励引导扩散]](RGD)框架,该框架在生成的视频中保持全局一致性和语义连贯性。大量实验表明,DualDiff在多个数据集上实现了最先进的([[SOTA]])性能。在[[NuScenes数据集]]上,DualDiff将[[FID分数]]降低了4.09%。在下游任务中,如[[BEV分割]],我们的方法将车辆[[mIoU]]提高了4.50%,道路mIoU提高了1.70%,而在[[BEV 3D目标检测]]中,前景[[mAP]]提高了1.46%。代码将在https://github.com/yangzhaojason/DualDiff上提供。 == 摘要 == * '''原文标题''':When Radiation Meets Linux: Analyzing Soft Errors in Linux on COTS SoCs under Proton Irradiation * '''中文标题''':当辐射遇上Linux:质子辐照下商用SoC上Linux软错误分析 * '''发布日期''':2025-03-05 18:21:34+00:00 * '''作者''':Saad Memon, Rafal Graczyk, Tomasz Rajkowski, Jan Swakon, Damian Wrobel, Sebastian Kusyk, Mike Papadakis * '''分类''':cs.OS, cs.AR, cs.SE *'''原文链接''':http://arxiv.org/abs/2503.03722v1 '''中文摘要''':在[[空间计算]]中,越来越多地使用商用现成([[COTS]])[[系统级芯片]]([[SoC]])上的 [[Linux]] 系统,这继承了 COTS 对[[辐射]]引起的故障(如[[软错误]])的敏感性。现代 SoC 加剧了这一问题,因为激进的[[晶体管]]缩放降低了引发软错误的关键电荷阈值,并增加了密集排列晶体管中的辐射效应,从而降低了整体[[可靠性]]。Linux 的[[单片架构]]放大了这些风险,因为紧密耦合的[[内核子系统]]将错误传播到关键组件(例如[[内存管理]]),而有限的[[纠错码]]([[ECC]])提供的缓解效果有限。此外,缺乏在运行 Linux 的 COTS SoC 上进行[[辐照测试]]的公开软错误数据,阻碍了可靠性的改进。本研究评估了[[质子辐照]](20-50 MeV)对三种 COTS SoC 架构上的 Linux 的影响:[[Raspberry Pi Zero 2 W]](40 nm [[CMOS]],[[Cortex-A53]])、[[NXP i.MX 8M Plus]](14 nm [[FinFET]],Cortex-A53)和 [[OrangeCrab]](40 nm [[FPGA]],[[RISC-V]])。辐照结果表明,与两种 40 nm CMOS 对应物相比,14 nm FinFET NXP SoC 在没有 ECC 内存的情况下实现了 2-3 倍的 Linux 正常运行时间,部分原因是 FinFET 减少了电荷收集。此外,本研究首次对现代 SoC 中易发生软错误的 Linux 内核组件进行了跨架构分析,以开发有针对性的缓解措施。研究结果为 Linux 在 COTS SoC 中的软错误敏感性提供了基础数据,为空间应用的任务准备提供了指导。 == 摘要 == * '''原文标题''':Neural Models of Task Adaptation: A Tutorial on Spiking Networks for Executive Control * '''中文标题''':神经任务适应模型:关于执行控制的脉冲网络教程 * '''发布日期''':2025-03-05 00:44:34+00:00 * '''作者''':Ashwin Viswanathan Kannan, Madhumitha Ganesan * '''分类''':q-bio.NC, cs.LG, cs.NE *'''原文链接''':http://arxiv.org/abs/2503.03784v1 '''中文摘要''':理解神经系统中[[认知灵活性]]和[[任务切换]]机制需要生物上可信的[[计算模型]]。本教程逐步介绍了如何构建一个[[脉冲神经网络]]([[SNN]]),以模拟[[认知控制网络]]中的任务切换动态。该模型结合了生物上真实的特征,包括[[侧向抑制]]、通过无监督的[[脉冲时间依赖可塑性]]([[STDP]])实现的自适应[[突触权重]],以及在生理相关范围内的精确[[神经元]]参数化。该SNN使用[[漏电积分-发放]]([[LIF]])神经元实现,代表兴奋性([[谷氨酸能]])和抑制性([[GABA能]])神经元群体。我们利用两个真实世界的[[数据集]]作为任务,展示了网络如何学习并在它们之间动态切换。实验设计遵循[[认知心理学]]范式,以分析[[神经适应性]]、突触权重修改以及涌现行为,如[[长时程增强]]([[LTP]])、[[长时程抑制]]([[LTD]])和[[任务集重构]]([[TSR]])。通过一系列结构化实验,本教程展示了任务切换间隔的变化如何影响性能和多任务效率。结果与实验观察到的神经元响应一致,为[[执行功能]]的计算基础提供了见解。通过遵循本教程,研究人员可以开发和扩展受生物启发的SNN模型,用于研究[[认知过程]]和神经适应性。
返回
WikiEdge:ArXiv速递/2025-03-05
。
导航菜单
个人工具
创建账号
登录
命名空间
项目页面
讨论
不转换
不转换
简体
繁體
大陆简体
香港繁體
澳門繁體
大马简体
新加坡简体
臺灣正體
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
工具
链入页面
相关更改
特殊页面
页面信息