WikiEdge:BioRxiv-2024.09.25.614826
- 标题:A massive community-science flower color dataset reveals convergent evolution of delayed flowering phenology in North American red-flowering plants
- 中文标题:一个大规模的社区科学花色数据集揭示了北美红花植物花期延迟的趋同演化
- 发布日期:2024-09-27
- 作者:McKenzie, P. F.; Berardi, A. E.; Hopkins, R.
- 分类:evolutionary biology
- 原文链接:https://www.biorxiv.org/content/10.1101/2024.09.25.614826
摘要:被子植物的辐射标志着花朵大小、形状、颜色、香气和奖励的惊人多样性。通过数百年的记录和量化,科学家们试图通过定义传粉综合症来理解这种变异,传粉综合症是远亲物种中常见的花朵特征的趋同演化,这些特征是通过选择优化传粉策略而演化的。现在,随着社区科学平台如iNaturalist的流行,任何人 - 不仅仅是科学家 - 都可以收集数据。由于高质量社区科学数据集的可用性,我们有了前所未有的观察自然开花植物多样性的机会。这些数据集为我们提供了开发新工具和检查新特征(如开花时间)的机会,这些特征可能有助于进一步描述传粉综合症。在这里,我们测试了开花现象也可以是传粉综合症的一个重要特征的假设;特别是"蜂鸟花"综合症,它通常以红色、长花冠管和突出的雄蕊为特征。我们使用GPT-4与视觉(GPT-4V)从社区科学照片中为11,729种北美开花植物种分配花色,从而产生了一个新的花色数据集。然后,我们将这些物种特异的颜色映射到1,674,908个公民科学家对开花植物的观察中。我们证明了在美国东部,红色或橙色花朵的物种的开花时间相对于其他颜色花朵的物种是受限的。重要的是,开花的开始时间与蜂鸟的到来时间密切相关。我们的发现揭示了扩展传粉综合症中包含的特征的机会,并表明蜂鸟传粉综合症可以包括开花现象。我们的方法展示了利用大量社区科学数据,提取关于特征变异模式的有价值信息的有效流程。
问题与动机
作者的研究问题包括:
- 如何利用社区科学平台(如iNaturalist)收集的大量数据来研究植物的花色表型?
- 花期(开花时间)是否也是传粉综合征的一个重要特征,尤其是对于以蜂鸟为传粉者的红色或橙色花植物?
- 在北美地区,红色和橙色花植物的开花时间是否与蜂鸟的到来时间密切相关?
- 社区科学数据和先进的计算机视觉模型(如GPT-4V)结合使用,能否有效地从大规模的植物花色数据中提取有价值的信息?
- 红色和橙色花植物的开花时间是否在东部美国受到限制,与蜂鸟的迁徙模式有关?
- 红色和白色开花植物的开花时间在不同地区是否存在差异,以及这些差异是否与特定传粉者(如蜂鸟和熊蜂)的出现有关?
背景介绍
这篇文献的背景主要集中在以下几个方面:
- 花的颜色与授粉生态学的关系:
- 社区科学数据在植物授粉研究中的应用:
- 社区科学数据集通常缺乏管理、格式化和特征规范,但它们提供了研究植物授粉综合症的新机会。
- 通过使用先进的计算机视觉模型,可以有效地从社区科学观察中提取大规模的植物特征数据。
- 该研究利用了GPT-4与视觉(GPT-4V)来分析美国各地的花卉颜色模式,生成了迄今为止最全面的北美花卉颜色数据库。
- 授粉时间与授粉综合症的关系:
综上所述,这篇文献的背景强调了利用社区科学数据和先进的计算机视觉技术来研究植物授粉综合症的新方法,以及探索授粉时间如何成为授粉综合症特征的新视角。
章节摘要
这篇论文是关于通过社区科学平台研究北美开花植物花色与授粉生态学的,主要内容包括:
- 引言
- 介绍了开花植物的多样化及其对授粉策略的适应,提出了“授粉综合征”的概念,即不同科植物为优化授粉而演化出的一系列共同的花特征。
- 强调了社区科学数据在研究授粉综合征中的应用潜力,尤其是iNaturalist平台提供的数据。
- 材料与方法
- 结果
- 讨论
- 讨论了开花时间作为授粉综合征的一个潜在特征的可能性,以及这一发现对于理解植物与授粉者相互作用的意义。
- 探讨了使用社区科学数据和计算机视觉进行大规模生态学研究的潜力和挑战。
- 结论
- 得出结论,开花时间是授粉综合征的重要组成部分,尤其是在蜂鸟授粉的植物中。
- 强调了利用社区科学数据进行生态学研究的可行性,并提出了未来研究的方向。
研究方法
这篇论文通过结合社区科学数据和先进的计算机视觉模型,创建了一个关于北美开花植物花色的大型数据库。以下是该研究方法论的主要组成部分:
- 社区科学数据收集:
- 利用iNaturalist平台收集北美开花植物的观察数据,包括物种鉴定、地理位置、开花状态和相关照片。
- 筛选出被标记为“开花”状态的研究级物种鉴定数据,并提取相关照片用于花色分析。
- 收集了超过167万条开花植物的观察记录,涵盖超过11,000个物种。
- 计算机视觉模型应用:
- 使用GPT-4V(具有视觉功能的生成性人工智能模型)对收集到的照片进行批量花色标注。
- 为每个物种分配一个代表性照片,并利用GPT-4V模型对这些照片进行颜色分类。
- GPT-4V模型能够以88%的准确率标注出物种的花色,仅有1,637个物种被标注为“未知”或“NaN”。
- 数据验证与分析:
- 授粉者与花色分布模式研究:
- 分析了红色和白色开花植物的分布与蜂鸟和熊蜂分布的关系。
- 使用MaxEnt模型预测不同花色植物的分布,并分析与授粉者分布的相关性。
- 发现红色和橙色开花植物的开花时间与蜂鸟的到来时间高度一致,而与熊蜂的分布关系不大。
- 综合分析:
- 结合花色数据库和授粉者分布数据,探讨了开花时间作为授粉综合征特征的可能性。
- 提出开花时间可能作为蜂鸟授粉植物的一个特征,扩展了对授粉综合征的理解。
- 讨论了利用社区科学数据和计算机视觉技术在大规模生态学研究中的应用潜力。
这篇论文的方法论分析结果表明,通过结合社区科学数据和先进的计算机视觉技术,可以有效地构建大规模的生态学数据库,并揭示植物与授粉者之间复杂的相互作用。
研究结论
根据提供的文献内容,这篇论文的主要结论可以概括如下:
- 红色和橙色开花植物的开花时间与蜂鸟迁徙模式相关联:在北美东部,红色和橙色开花植物的开花时间推迟,与蜂鸟迁徙的时间紧密相关。
- 开花时间作为传粉综合症的一个特征:研究表明,开花时间可以作为传粉综合症的一个特征,特别是对那些与蜂鸟传粉相关的植物。
- 利用社区科学数据的新方法:通过结合使用社区科学平台iNaturalist和GPT-4V模型,研究者们开发了一种新的方法来分析和提取大规模的植物表型数据。
- 红色开花植物与蜂鸟传粉综合症的关联:红色开花植物的开花时间与蜂鸟的出现时间相吻合,这表明开花时间可能是蜂鸟传粉综合症的一个组成部分。
- 开花时间与传粉者可用性的关系:开花时间与传粉者(如蜂鸟)的可用性有关,这可能影响植物的繁殖策略和进化。
- 社区科学数据的潜力和局限性:虽然社区科学数据存在偏差,如城市地区观察较多,但它为研究提供了大量的数据,有助于理解植物表型多样性。
- 未来研究方向:未来的研究可以扩展这种方法,包括更多的观察和/或额外的性状,以进一步探索植物表型和传粉者之间的相互作用。
术语表
这篇文章的术语表如下:
- 传粉综合征(pollination syndromes):指不同远缘植物在适应特定传粉策略或传粉者的过程中,演化出的一系列相关性状的集合。
- 被子植物(angiosperms):被子植物是一类种子植物,其种子被包裹在果实中。
- iNaturalist(iNaturalist):一个社区科学平台,允许公众记录自然多样性。
- GPT-4V(GPT-4 with Vision):一种先进的计算机视觉模型,用于从社区科学观察中提取大规模性状数据。
- 物候学(phenology):研究植物和动物的季节性周期及其与环境变化的关系。
- 花部性状(floral traits):指花的物理特征,如颜色、大小、形状、气味和花蜜。
- 虫媒传粉(entomophilous):指依赖昆虫进行传粉的植物。
- 风媒传粉(anemophilous):指依赖风进行传粉的植物。
- 蝇媒传粉(myophilous):指依赖苍蝇进行传粉的植物。
- 鸟媒传粉(ornithophilous):指依赖鸟类进行传粉的植物。
- 开花物候(flowering phenology):指植物开花的时间和季节性模式。
- 社区科学数据集(community-science datasets):由社区科学项目收集的大量数据集。
- 花色(flower color):花的可见颜色,对人类观察者来说是最明显的表型之一。
- 开花时间(flowering time):植物开花的具体时间。
- TRY植物性状数据库(TRY Plant Trait Database):一个大型且经过积极维护的植物性状数据库。
- 蜂鸟花综合征(hummingbird flower syndrome):通常以红色、长花冠筒和外露雄蕊为特征的植物。
- 最大熵模型(MaxEnt):一种用于物种分布建模的软件,用于推断物种在特定时间在每个像素点上的发生概率。
- 生态位建模(niche modeling):一种用于预测物种分布的方法,考虑物种出现的位置和环境变量的模式。
- 物种分布模型(species distribution models):用于预测物种分布的模型,通常包括环境变量。
- 花色频率(flower color frequencies):在特定地区或数据集中,不同花色出现的频率。
- 开花植物(flowering plants):指能够产生花并进行繁殖的植物。
参考文献
- Fenster, C. B., Armbruster, W. S., Wilson, P., Dudash, M. R. & Thomson, J. D. Pollination Syndromes and Floral Specialization. Annual Review of Ecology, Evolution, and Systematics 35, 375–403 (2004).
- 提供了关于传粉综合症和花的特化的综述,为理解植物与传粉者之间的相互作用提供了理论基础。
- Willmer, P. Pollination and Floral Ecology. (Princeton University Press, Princeton, 2011).
- 作为一本关于传粉和花生态学的权威著作,为本文提供了关于花的多样性和传粉策略的背景信息。
- Kattge, J. et al. TRY plant trait database – enhanced coverage and open access. Global Change Biology 26, 119–188 (2020).
- 提供了一个关于植物性状的数据库,本文利用这个数据库来比较和验证研究结果。
- Pellmyr, O. Evolution of insect pollination and angiosperm diversification. Trends in Ecology & Evolution 7, 46–49 (1992).
- 探讨了昆虫传粉和被子植物多样化的进化,为本文提供了进化背景。
- Wessinger, C. A., Rausher, M. D. & Hileman, L. C. Adaptation to hummingbird pollination is associated with reduced diversification in Penstemon. Evolution Letters 3, 521–533 (2019).
- 研究了蜂鸟传粉的适应性与植物多样性之间的关系,为本文提供了传粉适应性对植物进化影响的案例。