WikiEdge:BioRxiv-2024.09.25.614826
- 標題:A massive community-science flower color dataset reveals convergent evolution of delayed flowering phenology in North American red-flowering plants
- 中文標題:一個大規模的社區科學花色數據集揭示了北美紅花植物花期延遲的趨同演化
- 發布日期:2024-09-27
- 作者:McKenzie, P. F.; Berardi, A. E.; Hopkins, R.
- 分類:evolutionary biology
- 原文鏈接:https://www.biorxiv.org/content/10.1101/2024.09.25.614826
摘要:被子植物的輻射標誌着花朵大小、形狀、顏色、香氣和獎勵的驚人多樣性。通過數百年的記錄和量化,科學家們試圖通過定義傳粉綜合症來理解這種變異,傳粉綜合症是遠親物種中常見的花朵特徵的趨同演化,這些特徵是通過選擇優化傳粉策略而演化的。現在,隨着社區科學平台如iNaturalist的流行,任何人 - 不僅僅是科學家 - 都可以收集數據。由於高質量社區科學數據集的可用性,我們有了前所未有的觀察自然開花植物多樣性的機會。這些數據集為我們提供了開發新工具和檢查新特徵(如開花時間)的機會,這些特徵可能有助於進一步描述傳粉綜合症。在這裡,我們測試了開花現象也可以是傳粉綜合症的一個重要特徵的假設;特別是"蜂鳥花"綜合症,它通常以紅色、長花冠管和突出的雄蕊為特徵。我們使用GPT-4與視覺(GPT-4V)從社區科學照片中為11,729種北美開花植物種分配花色,從而產生了一個新的花色數據集。然後,我們將這些物種特異的顏色映射到1,674,908個公民科學家對開花植物的觀察中。我們證明了在美國東部,紅色或橙色花朵的物種的開花時間相對於其他顏色花朵的物種是受限的。重要的是,開花的開始時間與蜂鳥的到來時間密切相關。我們的發現揭示了擴展傳粉綜合症中包含的特徵的機會,並表明蜂鳥傳粉綜合症可以包括開花現象。我們的方法展示了利用大量社區科學數據,提取關於特徵變異模式的有價值信息的有效流程。
問題與動機
作者的研究問題包括:
- 如何利用社區科學平台(如iNaturalist)收集的大量數據來研究植物的花色表型?
- 花期(開花時間)是否也是傳粉綜合徵的一個重要特徵,尤其是對於以蜂鳥為傳粉者的紅色或橙色花植物?
- 在北美地區,紅色和橙色花植物的開花時間是否與蜂鳥的到來時間密切相關?
- 社區科學數據和先進的計算機視覺模型(如GPT-4V)結合使用,能否有效地從大規模的植物花色數據中提取有價值的信息?
- 紅色和橙色花植物的開花時間是否在東部美國受到限制,與蜂鳥的遷徙模式有關?
- 紅色和白色開花植物的開花時間在不同地區是否存在差異,以及這些差異是否與特定傳粉者(如蜂鳥和熊蜂)的出現有關?
背景介紹
這篇文獻的背景主要集中在以下幾個方面:
- 花的顏色與授粉生態學的關係:
- 社區科學數據在植物授粉研究中的應用:
- 社區科學數據集通常缺乏管理、格式化和特徵規範,但它們提供了研究植物授粉綜合症的新機會。
- 通過使用先進的計算機視覺模型,可以有效地從社區科學觀察中提取大規模的植物特徵數據。
- 該研究利用了GPT-4與視覺(GPT-4V)來分析美國各地的花卉顏色模式,生成了迄今為止最全面的北美花卉顏色數據庫。
- 授粉時間與授粉綜合症的關係:
綜上所述,這篇文獻的背景強調了利用社區科學數據和先進的計算機視覺技術來研究植物授粉綜合症的新方法,以及探索授粉時間如何成為授粉綜合症特徵的新視角。
章節摘要
這篇論文是關於通過社區科學平台研究北美開花植物花色與授粉生態學的,主要內容包括:
- 引言
- 介紹了開花植物的多樣化及其對授粉策略的適應,提出了「授粉綜合徵」的概念,即不同科植物為優化授粉而演化出的一系列共同的花特徵。
- 強調了社區科學數據在研究授粉綜合徵中的應用潛力,尤其是iNaturalist平台提供的數據。
- 材料與方法
- 結果
- 討論
- 討論了開花時間作為授粉綜合徵的一個潛在特徵的可能性,以及這一發現對於理解植物與授粉者相互作用的意義。
- 探討了使用社區科學數據和計算機視覺進行大規模生態學研究的潛力和挑戰。
- 結論
- 得出結論,開花時間是授粉綜合徵的重要組成部分,尤其是在蜂鳥授粉的植物中。
- 強調了利用社區科學數據進行生態學研究的可行性,並提出了未來研究的方向。
研究方法
這篇論文通過結合社區科學數據和先進的計算機視覺模型,創建了一個關於北美開花植物花色的大型數據庫。以下是該研究方法論的主要組成部分:
- 社區科學數據收集:
- 利用iNaturalist平台收集北美開花植物的觀察數據,包括物種鑑定、地理位置、開花狀態和相關照片。
- 篩選出被標記為「開花」狀態的研究級物種鑑定數據,並提取相關照片用於花色分析。
- 收集了超過167萬條開花植物的觀察記錄,涵蓋超過11,000個物種。
- 計算機視覺模型應用:
- 使用GPT-4V(具有視覺功能的生成性人工智能模型)對收集到的照片進行批量花色標註。
- 為每個物種分配一個代表性照片,並利用GPT-4V模型對這些照片進行顏色分類。
- GPT-4V模型能夠以88%的準確率標註出物種的花色,僅有1,637個物種被標註為「未知」或「NaN」。
- 數據驗證與分析:
- 授粉者與花色分布模式研究:
- 分析了紅色和白色開花植物的分布與蜂鳥和熊蜂分布的關係。
- 使用MaxEnt模型預測不同花色植物的分布,並分析與授粉者分布的相關性。
- 發現紅色和橙色開花植物的開花時間與蜂鳥的到來時間高度一致,而與熊蜂的分布關係不大。
- 綜合分析:
- 結合花色數據庫和授粉者分布數據,探討了開花時間作為授粉綜合徵特徵的可能性。
- 提出開花時間可能作為蜂鳥授粉植物的一個特徵,擴展了對授粉綜合徵的理解。
- 討論了利用社區科學數據和計算機視覺技術在大規模生態學研究中的應用潛力。
這篇論文的方法論分析結果表明,通過結合社區科學數據和先進的計算機視覺技術,可以有效地構建大規模的生態學數據庫,並揭示植物與授粉者之間複雜的相互作用。