常用降雨栅格数据集对比与选型指南

水文数据

常用降雨栅格数据集对比与选型指南

面向水文、气候、遥感和GIS分析,系统梳理中国及全球常用降雨栅格数据集,包括CHM_PRE、CN05.1、CMA格点降水、CMFD、CLDAS、CMPA、IMERG、GSMaP、MSWEP、CHIRPS、ERA5-Land等,并给出不同研究场景下的选型建议。

2026-05-21 水文数据 / 数据集
访问 评论

为什么要关注降雨栅格数据

降雨数据最常见的原始形态是雨量站观测记录,但水文模拟、气候变化分析、洪涝风险评估、农业干旱监测和 GIS 制图通常需要连续空间面的输入,这就需要把点状观测、卫星反演、雷达估计、再分析资料或多源融合结果转换为规则网格,也就是常说的降雨栅格数据集降水格点产品

这类数据看起来都是一张张降雨量栅格图,但来源差异很大。站点插值产品更接近地面观测,卫星产品覆盖广且时间分辨率高,再分析产品变量体系完整,多源融合产品则试图在精度、覆盖范围和时效之间折中。选错数据,后续模型结果、极端降雨统计和空间制图都会出现明显偏差。

本文按“实际研究中如何选择”的角度,梳理中国及全球常用降雨栅格数据集。

先看结论

如果只做中国大陆长期逐日降水分析,优先看 CHM_PRE V2。如果研究对象是小时级暴雨、城市内涝、山洪或台风降雨过程,应优先考虑 CMPA、CLDAS-V2.0、GPM IMERG、GSMaP、MSWEP 这类小时或半小时产品。若研究跨境流域、全球对比或没有本地站点资料,则可以选 IMERG、MSWEP、CHIRPS、ERA5-Land 等全球一致性产品。

一个简单判断规则是:

需求优先考虑
中国大陆长期逐日降水基准CHM_PRE V2
与既有中国气候研究对齐CN05.1、CMA 0.5°格点降水
小时级暴雨、内涝、山洪CMPA、CLDAS-V2.0、IMERG、MSWEP
陆面、水文、生态模型驱动CMFD 2.0、ERA5-Land
高空间分辨率制图HRLT、CDMet
跨境流域或全球一致性MSWEP、IMERG、CHIRPS、ERA5-Land
卫星降水产品对比IMERG、GSMaP、CMORPH、PERSIANN-CDR

主要数据集对比

数据集数据源入口类型覆盖与时段分辨率推荐用途注意事项
CHM_PRE V2TPDC DOIZenodo中国大陆站点观测、协变量和机器学习融合中国大陆;1960-2024,计划年更新0.1°;日尺度;月/年汇总中国大陆长期逐日降水、极端降水、水文模型基准日尺度为主,不适合小时暴雨过程
CN05.1中国气象数据网中国站点插值格点中国区域;常见版本多从 1961 年起0.25°;日/月气候变化、区域气候模式评估、与既有论文对齐公开入口和版本年份需核对
CMA 0.5° V2.0 中国地面降水格点中国气象数据网,常见代码 SURF_CLI_CHN_PRE_DAY_GRID_0.5SURF_CLI_CHN_PRE_MON_GRID_0.5官方站点插值产品中国区域;常见为 1961 年以来0.5°;日/月官方基准、长期降水气候统计分辨率偏粗,小流域和复杂地形不优先
HRLTNCDC 页面PANGAEA DOI中国 1 km 逐日气温/降水插值中国;1961-20191 km;日尺度高分辨率空间格局、生态和农业分析1 km 是统计插值/降尺度结果,不等同于 1 km 实测降雨
CDMetZenodoScientific Data中国 4 km 多气象要素格点中国大陆;2000-2020约 4 km;日尺度多变量生态、水文、农业模型输入时间长度较短,小时过程不可用
CMFD 2.0TPDC DOI清华 DESS 说明中国区域陆面气象强迫融合数据70°E-140°E、15°N-55°N 陆地;1951-20240.1°;3 小时陆面过程、水文和生态模型驱动降水是融合强迫变量,不是纯观测格点
CLDAS-V2.0CMA 知识服务页CMA 陆面数据同化/融合产品亚洲区域;近实时产品0.0625°;1 小时近实时监测、小时降水、业务分析历史长度和访问权限需按 CMA 当前说明核对
CMPA / CMA 多源融合降水中国气象数据网,常见入口如 SURF_CMPA_RT_NC自动站、卫星或雷达等多源融合中国区域;不同版本时段不同常见 0.1°或 0.05°;1 小时暴雨过程、卫星降水中国区验证基准CMA 入口、数据代码和版本变化较多
GPM IMERG V07NASA GPM 数据目录GES DISC Final 30 min全球多卫星降水,Final 产品含雨量站校正全球;2000 年以来0.1°;30 分钟、日、月跨区域暴雨、洪水、卫星降水对比中国山地、冷季、弱降水和极端峰值需校正
GSMaPJAXA GSMaP HourlyJAXA G-PortalJAXA 全球多卫星降水全球;1998 年以来0.1°;1 小时亚洲小时降水、台风和暴雨过程仍是卫星反演,复杂地形偏差明显
MSWEP V3GloH2O MSWEP站点、卫星、再分析机器学习融合全球;1979 年以来0.1°;小时;近实时全球一致性水文模拟、跨境流域、近实时分析许可和使用场景需核对,国内研究仍建议本地站点验证
CHIRPS v3UCSB CHIRPS v3数据仓库红外卫星和站点融合陆地 60°S-60°N;1981 年至近实时0.05°;日、候、旬、月、年干旱、农业、水文气候监测日尺度产品由候/月产品分配得到,不适合解释日内过程
ERA5-LandCopernicus CDS陆面再分析/模式产品全球陆地;1950 年以来约 0.1°;小时多变量一致的模型驱动、干旱和洪水背景分析降水是模式估计,不是直接观测;单位和累计方式要转换
CMORPH CDRNOAA NCEI CMORPHNOAA 卫星降水气候记录全球;1998 年以来约 8 km;30 分钟卫星产品对比、短历时降水分析中国区域通常需要站点校正
PERSIANN-CDRNOAA NCEI PERSIANN-CDR红外卫星和神经网络气候记录60°S-60°N;1982 年以来0.25°;日尺度长时间序列、极端和干旱对比研究分辨率较粗,中国精度通常不如本土站点融合产品
APHRODITEAPHRODITE 产品页NCAR Climate Data Guide亚洲雨量站插值亚洲/季风亚洲;不同版本覆盖不同0.25°/0.5°;日尺度亚洲跨境流域、历史对比站点密度随时空变化,趋势分析要谨慎
GPCCDWD GPCC 下载入口全球雨量站月降水格点全球陆地;长期月尺度产品0.25°、0.5°、1°、2.5°;月尺度百年尺度气候背景、月降水基准月尺度为主,不适合日/小时事件

按数据来源理解差异

1. 站点插值类

代表数据包括 CHM_PRE、CN05.1、CMA 0.5°格点降水、APHRODITE 和 GPCC。这类数据的优势是更接近地面雨量站观测,适合长期气候统计、日尺度降水、区域气候评估和论文中的基准对照。

它的主要问题是站点密度不均。在中国西部、高山峡谷、青藏高原边缘、沙漠和边境地区,网格值的可靠性会受到站点数量和插值方法影响。即使空间分辨率看起来很高,也不代表每个格网都有同等可信度。

2. 卫星反演类

代表数据包括 GPM IMERG、GSMaP、CMORPH 和 PERSIANN-CDR。这类产品覆盖广、时间分辨率高,特别适合暴雨过程、台风降雨、跨区域对比和缺站区域研究。

但卫星降水不是直接量雨。它依赖微波、红外等遥感信号反演,在复杂地形、冷季降雪、弱降水和强对流峰值上容易出现偏差。用于中国流域模型前,最好用本地雨量站或本土融合产品做校正。

3. 多源融合类

代表数据包括 CMFD、CLDAS、CMPA、MSWEP 和 CHIRPS。它们通常把站点、卫星、雷达、再分析或模式背景场结合起来,试图获得比单一数据源更稳定的结果。

融合产品要重点看三件事:是否使用了本地站点资料,时间延迟是否满足业务需求,目标变量是否是降水观测本身还是模型强迫变量。例如 CMFD 更适合作为陆面模型驱动,CMPA/CLDAS 更适合小时降水过程,MSWEP 更适合全球一致性水文模拟。

4. 再分析类

ERA5-Land 是最常见的再分析/陆面模式产品之一。它的优势是变量完整、时空连续、全球一致,适合需要温度、湿度、风、辐射、降水等多变量共同驱动的模型。

但再分析降水不是雨量站观测,也不是卫星直接反演结果,而是模式和同化系统输出。它适合做背景场、驱动场和跨变量一致分析,不宜未经校正就作为局地实测降雨替代。

典型场景怎么选

中国大陆长期逐日降水

首选 CHM_PRE V2。它覆盖 1960-2024 年,空间分辨率 0.1°,提供日尺度 NetCDF 以及月、年尺度 NetCDF/GeoTIFF 文件。对于年降水量、月降水距平、极端降水指数、SPI/SPEI 前处理和流域日降水序列,它比许多全球卫星产品更适合作为中国大陆基准。

如果要和早期论文或模式评估工作对齐,可以同时保留 CN05.1 或 CMA 0.5°格点降水作为敏感性对比。

小时级暴雨和城市内涝

不要用日尺度数据替代小时过程。城市内涝、山洪、短历时暴雨和台风降水过程更需要 1 小时或 30 分钟数据。国内业务和研究中可以优先查 CMPA、CLDAS-V2.0;跨区域或无 CMA 数据权限时,可考虑 IMERG、GSMaP、CMORPH 或 MSWEP。

需要注意,卫星小时降水常常能较好描述空间形态,但峰值强度、降水起止时间和山地降水仍需站点校正。

陆面、水文、生态模型

如果模型需要多个气象变量共同输入,可以优先考虑 CMFD 2.0 或 ERA5-Land。CMFD 更贴近中国及周边陆地区域应用,ERA5-Land 胜在全球一致性、变量完整和时间连续。

这类数据的降水变量更像“模型驱动用强迫数据”,而不是单独的降雨观测产品。做降水统计结论时,要把这一点写清楚。

农业干旱和季节监测

CHIRPS、MSWEP 和 CHM_PRE 都可以用于农业干旱、季节累计降水、降水距平和区域干湿变化。若研究区在中国大陆,CHM_PRE 更适合作为本土基准;如果研究区跨越多个国家或区域,CHIRPS 和 MSWEP 的全球一致性更方便。

高分辨率空间制图

HRLT 和 CDMet 的空间分辨率较高,适合做空间格局表达、生态环境分析、农业气候区划和地图制图。但高分辨率不等于高真实性,尤其不能把 1 km 或 4 km 的格点值理解成相应尺度上的真实雨量站观测。

使用前要检查的几个问题

  1. 时间尺度是否匹配:日尺度产品不能直接用于小时暴雨过程,月尺度产品不能用于单场洪水模拟。
  2. 空间分辨率是否真的有意义:统计降尺度得到的 1 km 数据,不代表 1 km 网格内有真实观测。
  3. 单位是否需要转换:常见单位包括 mm/day、mm/hour、mm/month、kg m-2 s-1、m 等,ERA5-Land 等产品尤其要注意累计量和单位转换。
  4. 缺失值和掩膜是否正确:NetCDF、GeoTIFF、HDF5 的缺失值编码不同,区域平均前应先处理无效值。
  5. 数据是否经过站点校正:Final、Late、Early、Near real-time 版本精度不同,不能混用。
  6. 许可是否允许当前用途:MSWEP、部分 CMA 数据和部分平台数据可能存在访问权限或使用限制,公开发表前应核对数据许可。

Python 读取示例

多数降雨栅格数据最终会以 NetCDF、GeoTIFF、HDF5 或 GRIB 形式提供。对于 NetCDF,可优先使用 xarray

import xarray as xr

ds = xr.open_dataset("precipitation.nc")
print(ds)
prec = ds["prec"]

对于多个年度文件,可以用 open_mfdataset 延迟读取:

from pathlib import Path
import xarray as xr

paths = sorted(Path("daily").glob("*.nc"))
ds = xr.open_mfdataset(paths, chunks="auto", combine="by_coords")
prec = ds["prec"]

GeoTIFF 更适合 GIS 制图和空间叠加,可用 rioxarray 读取:

import rioxarray

raster = rioxarray.open_rasterio("precipitation.tif", masked=True)
print(raster.rio.crs)

实际处理时,建议先把研究区边界、时间范围、时间尺度和单位统一,再做统计分析。不要在没有单位转换和时间聚合说明的情况下,把多个数据集直接相减或求平均。

小结

降雨栅格数据没有绝对最优,只有适不适合当前问题。中国大陆长期逐日研究优先 CHM_PRE V2;小时级过程优先 CMPA、CLDAS、IMERG 或 MSWEP;多变量模型驱动优先 CMFD 或 ERA5-Land;跨境和全球对比优先 IMERG、MSWEP、CHIRPS 等全球产品。

真正可靠的做法,是先按研究目标选择候选数据,再用本地雨量站、流域出口径流、历史暴雨记录或已有权威产品进行交叉验证。对于降雨这种空间变异极强的变量,数据来源、尺度和误差结构往往比文件格式本身更重要。

评论区