面向影响人群健康的主要外环境暴露因素,复旦大学公共卫生学院环境与健康团队开发了中国区域高分辨率和高时空覆盖度的外环境数据暴露评价数据平台。 该平台数据基于卫星遥感等多元数据融合和机器学习算法中的随机森林模型预测得到,时间分辨率最高可到日水平,空间分辨率最高可到1km水平, 时间跨度为2005-2021年,并持续更新。MED数据集目前包括的环境要素有: 细颗粒物(PM2.5) 、 粗颗粒物(PM2.5-10) 、 可吸入颗粒物(PM10) 、 臭氧(O3) 、 二氧化氮(NO2) 、 绿地指数(NDVI)的年最大值和年均值 、 紫外辐射(UV) 等七种环境数据的八类参数,更多与人群健康密切相关的环境要素数据也将逐步推出。MED数据库在空间上覆盖中国区域,可用数据的时间分辨率为日、月、年,空间分辨率为1km。该数据集将持续更新,并逐步开放下载。欢迎用户下载并提供宝贵的反馈意见。
文件命名:该数据以HDF文件格式存储,文件的名称为Env_China _T_mean_yyyy_pred_mean.h5,其中Env表示环境要素,T表示时间分辨率(daily表示日数据,monthly表示月数据,annual表示年数据),yyyy代表年。数据读取方式:可用R语言、Python等编程读取数据。
2005-2021年中国区域每日PM2.5浓度数据的空间分辨率为1km × 1km,单位为µg/m3。该数据基于机器学习算法中的随机森林模型预测得到,模型构建使用的预测变量包括大气校正气溶胶光学厚度(MAIAC AOD)、化学传输模式模拟的大气PM2.5浓度、气象参数、海拔高度和人口密度等多源数据。由于AOD季节性非随机缺失率较高,本数据已对卫星数据缺失引起的PM2.5预测数据缺失进行了补缺处理,因此得到的PM2.5日平均浓度实现了时空全覆盖。PM2.5地面测量值和随机森林模型预测值在日水平的总体十折交叉验证R2 和均方根误差 (RMSE) 分别为0.86和14.46 μg/m3。1km × 1km分辨率的月均、年均PM2.5浓度由日均PM2.5浓度平均而来。该数据集持续更新,数据下载请点击此处。
1. Xia Meng, Cong Liu, Lina Zhang, Weidong Wang, Jennifer Stowell, Haidong Kan, Yang Liu, Estimating PM2.5 concentrations in Northeastern China with full spatiotemporal coverage, 2005–2016. Remote Sensing of Environment 2021, 253, 112203.
2. Su Shi, Weidong Wang, Xinyue Li, Yun Hang, Jian Lei, Haidong Kan, Xia Meng, Optimizing modeling windows to better capture the long-term variation of PM2.5 concentrations in China during 2005–2019. Science of The Total Environment 2022, 158624.
2005-2021年我国PM2.5年均浓度图
2005-2021年中国区域每日PM10浓度数据的空间分辨率为1km × 1km,单位为µg/m3。该数据基于机器学习算法中的随机森林模型预测得到,模型构建使用的预测变量包括大气校正气溶胶光学厚度(MAIAC AOD)、化学传输模式模拟的大气PM10浓度、气象参数、海拔高度和人口密度等多源数据。数据同样已经针对卫星数据缺失进行了补缺处理,可达到时空全覆盖。PM10地面测量值和随机森林模型预测值在日水平的总体十折交叉验证R2 和均方根误差 (RMSE) 分别为0.88和20.92 μg/m3。1km × 1km分辨率的月均、年均PM10浓度由日均PM10浓度平均而来。注意:该数据集持续更新,数据下载请点击此处。
Evaluating the spatiotemporal PM2.5–10 characteristics with high–resolution predictions based on an ensemble model in China, 2013–2020. (投稿中)
2005-2021年我国PM10年均浓度图
2005-2021年中国每日PM2.5-10浓度由随机森林算法反演得到并对由于卫星数据引起的缺失进行了补缺处理,数据集的空间分辨率为1km × 1km,单位为µg/m3。该数据库基于机器学习算法中的随机森林模型预测得到。模型构建使用的预测变量包括大气校正气溶胶光学厚度(MAIAC AOD)、化学传输模式模拟的大气PM2.5-10浓度、气象参数、海拔高度和人口密度等多源数据。PM2.5-10地面测量值和随机森林模型预测值在日水平的总体十折交叉验证R2 和均方根误差 (RMSE) 分别为0.93和10.18 μg/m3。1km × 1km分辨率的月均、年均PM2.5-10浓度由日均PM2.5-10浓度平均而来。注意:该数据集持续更新,数据下载请点击此处。
Evaluating the spatiotemporal PM2.5–10 characteristics with high–resolution predictions based on an ensemble model in China, 2013–2020. (投稿中)
2005-2021年我国PM2.5-10年均浓度图
2005-2021年中国区域O3每日最大8小时平均(maximum daily 8-h average, MDA8)浓度由随机森林算法反演得到,数据集的空间分辨率为1km × 1km,单位为µg/m3。该数据库基于机器学习算法中的随机森林模型预测得到。模型构建使用的预测变量包括化学传输模式模拟的大气O3每日最大8小时平均浓度、气象参数、能见度、路网、海拔高度和人口密度等多源数据。O3地面测量值和随机森林模型预测值在日水平的总体十折交叉验证R2 和均方根误差 (RMSE) 分别为0.91和9.22 μg/m3。1km × 1km分辨率的月均、年均O3浓度由日均O3浓度平均而来。注意:该数据集持续更新,数据下载请点击此处。
Xia Meng, Weidong Wang, Su Shi, Shengqiang Zhu, Peng Wang, Renjie Chen, Qingyang Xiao, Tao Xue, Guannan Geng, Qiang Zhang, Haidong Kan, Hongliang Zhang. Evaluating the spatiotemporal ozone characteristics with high-resolution predictions in mainland China, 2013–2019. Environmental Pollution 2022, 299, 118865.
2005-2021年我国O3年均浓度图
2005-2021年中国区域每日NO2浓度由随机森林算法反演得到,数据集的空间分辨率为1km × 1km,单位为µg/m3。该数据集以NO2地面测量值作为因变量,以卫星遥感反演的TROPOMI/OMI NO2柱浓度数据、化学传输模型模拟的NO2浓度、气象参数、人口密度、道路长度和海拔高度作为预测变量建立随机森林模型。数据同样已经针对卫星数据缺失进行了补缺处理,可达到时空全覆盖。NO2地面测量值和随机森林模型预测值在日水平的总体十折交叉验证R2 和均方根误差 (RMSE) 分别为0.76和9.27 μg/m3。1km × 1km分辨率的月均、年均NO2浓度由日均NO2浓度平均而来。注意:该数据集持续更新,数据下载请点击此处。
Xinyue Li, Peng Wang, Weidong Wang, Hongliang Zhang, Su Shi, Tao Xue, Jintai Lin, Yuhang Zhang, Mengyao Liu, Renjie Chen, Haidong Kan, Xia Meng, Mortality burden due to ambient nitrogen dioxide pollution in China: Application of high-resolution models. Environment International 2023, 176, 107967.
2005-2021年我国NO2年均浓度图
2005-2020年中国区域每日UV数据由随机森林算法反演得到,数据集的空间分辨率为10km × 10km,单位为W/m2。该数据集以UV地面监测站测量值作为因变量,以OMI的红斑加权每日剂量(EDD)、ERA-5 的UV数据、气象参数、臭氧、太阳天顶角、地表反照率、海拔作为预测变量建立随机森林模型。数据同样已经针对卫星数据缺失进行了补缺处理,可达到时空全覆盖。UV地面测量值和随机森林模型预测值在日水平的总体十折交叉验证R2和均方根误差 (RMSE) 分别为0.80和37.94 W/m2。10km × 10km分辨率的月均、年均UV由日均UV平均而来。注意:该数据集持续更新,数据下载请点击此处。
Evaluation of spatial and temporal distributions of ultraviolet radiation in China based on high-resolution predictions: 2005-2020.(投稿中)
2005-2020年我国UV年均值图
该数据集包括2005-2021年中国区域年均及年最大NDVI。原始数据由搭载于 Terra 卫星上的中等分辨率成像光谱辐射计Moderate Resolution Imaging Spectroradiometer (MODIS)得到。本数据平台选择的数据产品为MOD13Q1,其空间分辨率为250m × 250m,原始数据时间分辨率为16 天。剔除云、雪和水体影响的数据,计算得到年平均NDVI和年最大NDVI数据,数据空间分辨率为250m × 250m,时间分辨率为年。NDVI 的值域在-1到1之间。正值越接近1表示植被密度越高,接近0表示裸土。负值表示水、雪(数据提取时已排除)。注意:该数据集持续更新,NDVI年最大数据下载请点击此处,NDVI年均值数据下载请点击此处。
2005-2021年我国NDVI年均值空间分布图
2005-2021年我国NDVI年最大值空间分布图