CHM_PRE V2 数据集概览
CHM_PRE V2 是一个面向中国大陆区域的长期、日尺度、高精度网格降水数据集。它在 CHM_PRE V1 的基础上升级,综合利用地面降水观测、空间自相关信息以及多类降水相关协变量,通过改进的反距离权重方法和 LightGBM 机器学习模型生成连续网格降水产品。
与单纯依赖站点插值或卫星反演的降水产品相比,CHM_PRE V2 的重点在于同时考虑降水的空间相关性和地形、地表、气象背景等协变量影响,尤其适合中国西部、高原边缘、站点相对稀疏区域的水文气象分析。
核心信息
| 项目 | 说明 |
|---|---|
| 数据名称 | CHM_PRE V2 |
| 最新版本 | V2.1 |
| 时间范围 | 1960年1月1日-2024年12月31日 |
| 空间范围 | 中国大陆,约18°N-54°N、72°E-136°E |
| 空间分辨率 | 0.1° |
| 时间分辨率 | 日尺度;同时提供月总量和年总量产品 |
| 主要变量 | prec 降水量,另含 lat、lon、time |
| 数据格式 | NetCDF、GeoTIFF |
| 数据许可 | Creative Commons Attribution 4.0 International(CC BY 4.0) |
| 适用方向 | 水文模拟、气候评估、极端降水、干旱洪涝分析、农业与灾害风险研究 |
Zenodo 记录显示,V2.1 版本已将数据覆盖期延伸至 2024 年,并对喜马拉雅南麓等青藏高原边缘区域的降水值进行了调整。完整数据体量较大,下载前应根据研究需求优先选择日、月或年尺度文件。
数据文件组成
CHM_PRE V2 主要包含以下几类文件:
| 文件类型 | 文件名示例 | 说明 |
|---|---|---|
| 元数据说明 | metadata / description file | 数据集说明、变量解释、使用说明等 |
| 日尺度数据 | CHM_PRE_V2_daily_1960.nc | 每年一个 NetCDF 文件,变量单位为 mm/day |
| 年总量数据 | CHM_PRE_V2_annual.nc、CHM_PRE_V2_annual.tif | 逐年总降水量,提供 NetCDF 和 GeoTIFF |
| 月总量数据 | CHM_PRE_V2_monthly.nc、CHM_PRE_V2_monthly.tif | 逐月总降水量,提供 NetCDF 和 GeoTIFF |
NetCDF 文件中的核心变量为:
| 变量 | 含义 | 备注 |
|---|---|---|
lat | 纬度 | 单位为度 |
lon | 经度 | 单位为度 |
time | 时间维度 | 以1960年1月1日为起算基准 |
prec | 降水量 | 日值单位为 mm/day,月值为 mm/month,年值为 mm/year |
GeoTIFF 文件采用 WGS84 坐标参考,缺失值使用 -9999 标记。对 GIS 用户而言,年尺度和月尺度 GeoTIFF 更适合快速制图、裁剪和空间叠加;对长时间序列分析而言,NetCDF 更适合用 Python、R 或专业气候水文工具批量处理。
数据质量与方法特点
CHM_PRE V2 的数据论文在验证中使用了高密度站点资料进行对比评估。公开说明给出的关键指标包括:
- 平均绝对误差(MAE)约为 1.48 mm/day。
- Kling-Gupta Efficiency(KGE)约为 0.88。
- 降水事件识别的 Heidke Skill Score(HSS)约为 0.68。
- False Alarm Ratio(FAR)约为 0.24。
这些指标说明该数据集不仅关注降水量数值本身,也关注是否正确识别降水事件。对于洪涝、干旱、径流模拟等问题,事件识别能力往往和总量精度同样重要。
适合哪些研究使用
1. 水文模型输入
日尺度网格降水可以作为 SWAT、VIC、HEC-HMS、WEP-L、TOPMODEL 等水文模型的气象驱动数据,也可以用于流域平均降水、面雨量计算和径流响应分析。
2. 极端降水和洪涝风险
长期连续的 1960-2024 年序列适合计算年最大日降水、连续降水日数、暴雨频次、极端降水指数及其年代际变化,为城市内涝、山洪、滑坡泥石流风险评估提供降水背景。
3. 干旱和水资源评估
月总量和年总量产品可以用于降水距平、SPI/SPEI 前处理、区域干湿变化、水资源分区评价,以及与蒸散发、土壤湿度、径流数据的综合分析。
4. 气候变化与区域对比
0.1° 分辨率兼顾全国覆盖和区域分析精度,适合比较东部季风区、西北干旱区、青藏高原及其边缘地带的降水变化差异。
5. GIS 制图与教学
GeoTIFF 版本可以直接导入 QGIS、ArcGIS、Global Mapper 等 GIS 软件,用于年降水量空间分布图、月降水格局图、流域裁剪和专题制图。
获取入口
这三个链接对应同一个数据集的不同访问入口,建议以 Zenodo 记录和数据论文作为引用与版本核验依据:
下载时建议核对以下信息:
- 文件名是否为
CHM_PRE_V2_*系列。 - 版本是否为 V2.1 或后续更新版本。
- 时间范围是否覆盖到 2024 年。
- 文件大小和 MD5 是否与发布页一致。
- 研究引用中是否同时注明数据集 DOI 和数据论文 DOI。
Python 快速读取示例
如果只读取月尺度 NetCDF,可使用 xarray:
import xarray as xr
ds = xr.open_dataset("CHM_PRE_V2_monthly.nc")
print(ds)
monthly_prec = ds["prec"]
如果需要把逐年日尺度文件合并为一个虚拟数据集,建议使用 open_mfdataset 并启用分块读取:
from pathlib import Path
import xarray as xr
paths = sorted(Path("daily").glob("CHM_PRE_V2_daily_*.nc"))
ds_daily = xr.open_mfdataset(paths, chunks="auto", combine="by_coords")
daily_prec = ds_daily["prec"]
对于 GeoTIFF,可直接在 GIS 软件中打开;如需在 Python 中读取,可使用 rioxarray:
import rioxarray
annual = rioxarray.open_rasterio("CHM_PRE_V2_annual.tif", masked=True)
print(annual)
使用注意事项
- 数据体量较大:完整数据超过数十 GB,日尺度文件按年份组织,适合按研究区和时间段分批下载、裁剪和计算。
- 单位要区分:日尺度为
mm/day,月尺度为mm/month,年尺度为mm/year,不要在多尺度混合分析时直接相加或比较。 - 缺失值要处理:NetCDF 中缺失值通常表示为
NaN,GeoTIFF 中缺失值为-9999,计算区域统计前应先屏蔽。 - 空间范围是中国大陆:如研究区域涉及港澳台、海岛或跨境流域,应额外检查边界覆盖和掩膜处理。
- 引用要完整:公开发表论文、报告或数据产品时,应同时引用数据集页面和 ESSD 数据论文。
推荐引用
数据集 DOI:
Hu, J., Miao, C., & Zhang, Q. CHM_PRE V2 dataset. Zenodo. https://doi.org/10.5281/zenodo.15735374
数据论文:
Hu, J., Miao, C., Su, J., Zhang, Q., Gou, J., & Sun, Q. (2025). An upgraded high-precision gridded precipitation dataset for the Chinese mainland considering spatial autocorrelation and covariates. Earth System Science Data, 17, 3987-4004. https://doi.org/10.5194/essd-17-3987-2025
小结
CHM_PRE V2 的价值在于,它把长期地面观测、空间自相关和多源协变量共同纳入降水网格化过程,提供了 1960-2024 年中国大陆 0.1° 日尺度降水资料。对于需要长期、连续、空间一致降水输入的水文、气候、灾害和 GIS 分析任务,它是一个值得优先关注的基础数据集。




评论区