大数据背景下的生态系统观测与研究
于贵瑞1,2 , 何洪林1,2 , 周玉科1     
1. 中国科学院地理科学与资源研究所 生态系统网络观测与模拟重点实验室 北京 100101;
2. 中国科学院大学 资源与环境学院 北京 100190
摘要:全球变化和可持续发展等一系列全球化的资源环境问题日益严峻,成为国际社会关注及科学研究热点,生态学的研究重点也逐渐开始由小尺度的个体、群落和生态系统向区域、大陆乃至全球尺度转变。同时,伴随传感器技术和信息网络技术发展,生态系统观测也从短时间观测逐渐向长期观测以及生态系统的宏观结构和生态服务时空格局变化协同观测转变;由过去的定位及小规模合作观测向区域甚至全球大规模联合的网络化观测、天-空-地立体综合观测方向转变。生态学研究已经进入大数据时代,如何应用大数据技术,实现传统的基于过程的生态学研究与基于大数据驱动的生态学研究的有机整合,推动生态学大理论发展、区域及全球生态系统演变机理研究,支撑以应对全球气候变化、生态系统功能维持等为核心的人类社会可持续发展理论和应用研究,是大数据时代生态观测研究面临的重大挑战及机遇。文章评述了生态系统观测研究现状,探讨了大数据背景下生态系统观测研究的重要特征,并建议遵循“大科学、大数据”理念,组织实施国家生态系统观测大科学工程建设,实现我国生态观测研究与全球生态观测研究体系的融合,实现在区域、国家及全球尺度上观测地球生命系统变化,诊断生态系统功能状态,理解生态系统过程机理、维持和保护生态系统功能,服务人类社会可持续发展的科技目标。
关键词生态观测网络    大数据    宏生态学    物联网    大科学工程    
Ecosystem Observation and Research under Background of Big Data
YU Guirui1,2, HE Honglin1,2, ZHOU Yuke1     
1. CAS Key Laboratory of Ecosystem Network Observation and Modeling, Institute of Geographic Sciences and Natural Resources Research, Chinese Academy of Sciences, Beijing 100101, China;
2. College of Resources and Environment, University of Chinese Academy of Sciences, Beijing 100190, China
Author: YU Guirui  Deputy Director of Institute of Geographic Sciences and Natural Resources Research, Chinese Academy of Sciences (CAS); Director of CAS Key Laboratory of Ecosystem Network Observation and Modeling.Dr.Yu is also the Director of Synthesis Research Center of Chinese Ecosystem Research Network (CERN) and Director of Long-term Ecological Committee of Ecological Society of China, a member of Asia Flux Network (AsiaFlux) Steering Committee.Dr.YU has hosted several programs, including CAS Major Program of Knowledge Innovation, the Hundred Talents Program, and National Key Research&Development Program.He has published more than 110 SCI papers and 10 books.Dr.Yu has received the First Prize of National Science and Technology Progress Award, and First Prize of Science and Technology Award from the Ministry of Environmental Protection of China.His research focuses on flux, ecophysiology, agronomy, water transfer in soil-plant-atmosphere-continuum, carbon, water and nitrogen cycles in terrestrial ecosystem.E-mail:yugr@igsnrr.ac.cn
Corresponding author: YU Guirui
Abstract: As a series of global problems, such as global change and sustainable development, have become the hotspots in the literature, ecological research has evolved from local scale to regional, continental or even global scale. Meanwhile, with the development of sensor and network technology, the focus of ecosystem observations has changed from short-time observations to long-term observations on the macrostructure of ecosystem and the spatio-temporal pattern of ecosystem services, also from the small-scale observation to regional and even global scale network observation and space-ground integrated observation. In summary, ecological studies have entered the big data era. It is a challenge and opportunity that how to apply the new technology, multi-disciplinary knowledge integration, multi-scale and multisource data integration, and big-data-driven ecological model development to achieve the integration between traditional ecological processbased ecological research and big-data-driven ecological research. Big-data-driven ecology should promote the development of ecological theory, mechanism research of regional and global ecosystem evolution and sustainable development of human society under the background of global climate change, biodiversity protection, and ecosystem function maintenance. This paper reviews the current status of ecosystem observation and research, and discusses the important characteristics of ecosystem observation and research under the background of big data. We suggest organizing and implementing the construction of national ecosystem observation project by using new technologies such as intelligent interconnection of big data and Internet of Things, data fusion-mining and high-performance computing. This project aims to realize the integration of China's ecological observation research and global ecological observation research system, to find the changes in the Earth's life system at regional, national, and global scales, to diagnose the state of ecosystem functions and understand the mechanism of ecosystem processes, and to maintain and protect ecosystem functions, thereby serving the scientific and technological goals of sustainable development of human society.
Keywords: ecological observation network     big data     macroecology     Internet of Things     big science project    

随着人类命运共同体、可持续发展、生态安全等一系列全球生态环境问题成为新时期人类社会发展面临的现实问题,生态文明建设成为中华民族永续发展的千年大计,这对生态学的研究提出了新的要求。如何实现从小尺度到大尺度(全球)、从短期到长期的观测,获取全球尺度生态系统观测数据,认知区域乃至全球生态系统动态变化规律,保护和恢复生态系统是当前生态系统观测研究面临的重大挑战。国际生物学计划(International Biological Program,1964—1974年)的实施,逐步形成了生态学领域“大科学、大数据”理念,即通过实施大科学工程,获取海量观测数据,开展协同科学研究。随后催生了长期生态学研究网络(LTER)[1],标志着生态学领域进入“大科学、大数据”时代。当前区域/全球尺度的网络化生态系统长期观测成为获取大尺度生态信息的重要平台,如LTER、英国环境变化监测网络(ECN)、中国生态系统研究网络(CERN)等,使得获取海量、大尺度、多源异构生态数据成为可能[2, 3]。生态学已从一门依靠小规模合作与短时间个人观测的实验学科演化为一门实施长时间大规模观测、跨学科合作的大数据学科。

在大数据时代,如何获取海量生态数据,如何基于大数据实现生态学“大”理论的发展和突破,服务于新时期生态文明建设等重大问题的解决,具有重要意义。本文首先论述了目前生态系统观测研究现状,其次分析了大数据时代生态系统观测研究特征,最后提出了我国大数据背景下的生态系统观测研究发展建议。

1 生态系统观测研究现状

纵观生态学发展的历程和趋势,目前生态系统观测研究呈现以下特征。

1.1 生态观测技术迅猛发展,全球新一代生态观测研究网络逐步形成

生态系统观测与实验是获取生态数据的重要手段[4]。近年来,生态观测技术发展迅猛,极大地提升了微观和宏观尺度生态观测数据的获取能力。例如:分子标记引入生态学领域引发了宏观生物学研究的革命;稳定同位素技术可追踪碳、氮、水等地球化学循环过程;高通量野外观测技术,如涡度相关技术实现了对生态系统功能变化的直接测定。全球新一代多尺度生态观测研究网络逐步形成,如基于物联网、自动观测、融合地面和遥感观测的美国国家生态观测网络(NEON)与澳大利亚生态观测研究网络(TERN)成为新一代大陆尺度生态观测研究网络的代表。这些新一代生态观测研究网络使用了大量生态观测传感器,涵盖多种观测指标,采集海量多源异构数据,为生态学研究进入“大数据时代”奠定了坚实的基础。

1.2 生态系统与全球变化成为生态学研究热点,跨尺度整合成为生态学研究前沿问题

随着人类活动对地球系统的影响日益加深,陆地表层的生态学过程发生强烈变化,生态系统服务局部显著下降,而人口增加和生活水平的提高则对生态系统服务提出更高要求。全面认识生态系统的结构功能及其与环境变化的关系成为现代生态学研究的重点,也是应对全球气候变化、生物多样性保护和维持生态系统功能的核心研究内容[5]。同时,面对生态系统的复杂性和多尺度等特征,目前还没有发展出统一的大理论对多个层次的众多过程在多时间尺度上进行概括,也没有建立一套有效的方法开展多尺度的定量描述和整合分析。因此,如何整合不同尺度的生态学过程,使从分子到个体层次的生态学现象能够在现实的生态系统格局和过程中得到体现,实现理论上的发展;如何在全球尺度开展跨生态系统研究,实现对从大陆到全球尺度的生态学过程认识,从而更好地管理生态系统,为社会和人类福祉服务,是当前生态学的研究前沿。

2 大数据时代生态系统观测研究的特征

随着生态学从分子尺度到全球尺度的研究,实现多尺度、多要素、多过程海量生态观测数据的获取,实现传统的基于过程的生态学研究与基于大数据驱动的生态学研究的有机整合,推动生态学大理论发展、区域及全球生态系统演变机理研究,形成开放共享的大数据文化,支撑以应对全球气候变化、生物多样性保护和生态系统功能维持为核心的人类社会可持续发展理论和应用研究,是大数据时代生态观测研究面临的重大挑战及机遇(图 1)。

图 1 生态大数据多尺度、多要素、多过程特征与潜在重大发现、理论突破
2.1 天-空-地多尺度观测技术和公民科学的发展是获取生态大数据的重要驱动力

随着生态学向着分子尺度(超微观)和全球尺度(超宏观)两个极限不断扩展研究领域,生态观测正从传统的、不连续的样方地面观测向“天-空-地”多尺度、多要素、多过程的综合观测转变,从由单一的生态学研究人员参与向全民参与的“公民科学”模式转变。以物联网技术为支撑的多尺度、多要素、多过程的生态观测体系逐渐成为新一代生态观测系统的重要特征。即借助多种物联网通信手段,形成“天-空-地”一体化的塔群式协同观测系统(图 2a),集成小尺度的个体仪器、通量塔,到区域/全球尺度的无人机和卫星等传感器载体,通过WiFi、ZigBee等物联网技术组建通讯便捷的局域观测网络,实现生态观测数据的实时传输、远程控制和智能报警,实现生态系统多尺度(从分子水平到全球范围)、多要素(水、土、气、生等)、多过程(碳循环、水循环、能量循环等)观测数据的稳定获取。

图 2 生态大数据的主要数据来源 (a)“天-空-地”物联网观测网络;(b)公民科学

大尺度生态学研究需要不同学科背景的科研人员参与,也离不开社会公众参与(图 2b)。互联网技术的发展,促进了公民科学发展。近年来,全世界建立了许多公民科学项目平台,利用“公民科学家”参与收集更多环境数据。例如,美国的BudBurst项目吸引全美人民合作收集植物生命周期数据,帮助发现植物如何应对环境变化。公民科学项目逐渐成为生态大数据的另一个重要来源。

2.2 多源、多尺度数据整合挖掘与模拟预测成为大数据时代生态学研究的重要手段

遥感数据、长期定位观测数据、实验以及模型模拟数据的快速膨胀有力地促进了生态数据挖掘和分析技术的发展。多源、多尺度整合挖掘与模拟预测成为大数据时代生态学研究的重要手段。大数据支持下的生态数据整合挖掘方法包括三大类:① Meta分析方法;②基于数据驱动的数据挖掘方法;③基于过程机理的模型—数据融合方法。其中Meta分析主要是从已有研究案例中,对多个有共同研究目标又相互独立的研究结果给予定量合并,剖析研究间差异特征,综合评价研究结果;以深度学习为代表的人工智能数据挖掘技术,能够实现多种生态要素之间的深层神经网络式映射关系,有望在已有生态学框架下获取新的认知,继而反推潜在的生态学内部机理;由于人们无法通过观测和控制实验等方法全面获取或者预测区域/全球尺度生态系统状况,计算机模拟分析大尺度生态系统结构和功能变化成为生态模拟预测的一个重要途径。虽然生态观测数据量日益增多,但模型模拟的不确定性仍然显著,而基于过程机理的模型数据融合方法为应用海量数据进行模型评估、基准测试和约束以降低不确定性提供了新的途径。这些方法为及时、有效地集成挖掘不同站点、区域、时间序列、生态系统过程和要素的观测和实验数据,揭示生态系统过程机理、变异规律、对环境因子的响应等普遍规律,以及服务于生态系统管理和决策提供了重要手段。

2.3 生态大数据推动生态学“大理论”和新兴学科的发展

由于生态学研究对象的复杂化和长期、海量观测数据的缺失,导致研究人员对生态过程和模式的认知都存在极大不确定性,生态学尚未发展出一个能够被广泛接受、在最大程度上解释及精确预测不同尺度上生态学现象和过程的统一化理论框架[6]。受数据洪流影响,以数据为中心思考、设计和实施科学研究,通过对海量数据的处理和分析来获得科学发现的新范式(第四范式)正逐渐在生态学中出现。同时,大数据时代更需要发展高效的大理论,即从基本原理出发,用最少的参数做出大量的理论预测[7]。由于生态系统组成的多样性及其相关关系的复杂性,不管获得的数据量有多大,如果没有大理论支撑,大数据将会在很大程度上失去其力量和有效性,不得不依赖于统计相关性而进行简单的归纳分析,永远都无法准确预测生态系统变化。只有在海量多尺度、多要素、多过程生态数据支撑下,准确认识生态系统的过程和模式,才可能发展一个统一化的理论框架,集成多源、多尺度数据整合技术和生态模拟预测技术,才能提高生态系统属性和生态过程的预测能力,促进新的生态学科,如宏生态学、预测生态学的发展。

2.4 数据开放共享文化亟待培养加强

大数据时代,只有形成开放共享、协同合作的大数据文化,才能真正发挥生态大数据的价值。观测数据是生态学研究的生命线,生态学家将自己的观测数据视为珍宝。大数据时代,只有打破数据封闭的传统模式,形成开放共享的“数据思维”模式,才有可能解决大尺度大生态问题。数据众包采集、数据出版与数据标识等新颖的数据获取和知识产权保护方式的深入应用,也将促进生态领域的数据开放共享。

3 大数据背景下我国生态系统观测研究的展望

自20世纪80年代长期生态研究计划的实施起,生态学研究已与“大科学、大数据”理念紧密耦合。中国生态系统研究网络(CERN)自1988年开始建立,已形成由44个观测台站组成的涵盖我国不同生态系统类型的观测研究网络,积累了大量科学数据。在大数据时代,一方面利用大数据技术,充分整合挖掘我国已有数据资源,推动生态学研究发展;同时应遵循“大科学、大数据”理念,充分应用传感器、物联网、大数据技术,实施生态大科学工程计划,实现生态系统观测研究的跨越发展,有效地支撑国家生态文明建设。

(1)在数据开放共享基础上,积极推动生态数据整合挖掘研究。我国在生态系统结构和功能等方面进行了长期观测和研究,积累了大量数据。例如:CERN收集了我国不同生态系统的长期观测实验数据,中国陆地生态系统通量观测研究网络(ChinaFLUX)进行了长达15年的碳水通量监测;“地球科学大数据工程”的实施,提供了先进的大数据整合挖掘手段,为开展全国尺度的生态系统结构、功能、过程以及重大科学问题的综合集成研究奠定了基础。

(2)积极推动“中国陆地生态系统观测研究网络”大科学工程建设(图 3)。实现国家尺度的天-空-地一体化、观测-实验-模拟三位一体、多尺度-多要素-多过程协同观测,覆盖全国不同生态区的分布式、网络化观测和实验科学设施,实现国家尺度的联网观测、联网实验、模拟与预测。从而实现我国生态观测研究与全球生态观测研究体系融合,实现在区域、国家及全球尺度上观测地球生命系统变化,诊断生态系统功能状态,理解生态系统过程机理、维持和保护生态系统功能,服务人类社会可持续发展的科技目标。

图 3 生态大科学工程:中国陆地生态系统观测试验网络(CEOBEX)概念设计
参考文献
[1]
Aronova E, Baker K S, Oreskes N. Big science and big data in biology:From the international geophysical year through the international biological program to the long term ecological research (lter) network, 1957——present[J]. Hist Stud Nat Sci, 2010, 40: 183-224. DOI:10.1525/hsns.2010.40.2.183
[2]
Hampton S E, Strasser C A, Tewksbury J J, et al. Big data and the future of ecology[J]. Frontiers in Ecology and the Environment, 2013, 11(3): 156-162. DOI:10.1890/120103
[3]
Jonathan T O, Gerald A M, Sandrine Bony, et al. Special online collection:dealing with data[J]. Science, 2011, 331(6018): 639-806.
[4]
戴圣骐, 赵斌. 大数据时代下的生态系统观测发展趋势与挑战[J]. 生物多样性, 2016, 24: 85-94. DOI:10.17520/biods.2015150
[5]
Millennium Ecosystem Assessment. Ecosystems and human wellbeing:general synthesis[M]. Washington, DC: Island Press and World Resource Institute, 2005: 77-101.
[6]
Anonymous. An elegant chaos[J]. Nature, 2014, 507(7491): 139.
[7]
Marquet P A, Allen A P, Brown J H, et al. On theory in ecology[J]. Bioscience, 2014, 64: 701-710. DOI:10.1093/biosci/biu098