常用降雨栅格数据集对比与选型指南

为什么要关注降雨栅格数据

降雨数据最常见的原始形态是雨量站观测记录，但水文模拟、气候变化分析、洪涝风险评估、农业干旱监测和 GIS 制图通常需要连续空间面的输入，这就需要把点状观测、卫星反演、雷达估计、再分析资料或多源融合结果转换为规则网格，也就是常说的降雨栅格数据集或降水格点产品。

这类数据看起来都是一张张降雨量栅格图，但来源差异很大。站点插值产品更接近地面观测，卫星产品覆盖广且时间分辨率高，再分析产品变量体系完整，多源融合产品则试图在精度、覆盖范围和时效之间折中。选错数据，后续模型结果、极端降雨统计和空间制图都会出现明显偏差。

本文按“实际研究中如何选择”的角度，梳理中国及全球常用降雨栅格数据集。

先看结论

如果只做中国大陆长期逐日降水分析，优先看 CHM_PRE V2。如果研究对象是小时级暴雨、城市内涝、山洪或台风降雨过程，应优先考虑 CMPA、CLDAS-V2.0、GPM IMERG、GSMaP、MSWEP 这类小时或半小时产品。若研究跨境流域、全球对比或没有本地站点资料，则可以选 IMERG、MSWEP、CHIRPS、ERA5-Land 等全球一致性产品。

一个简单判断规则是：

需求	优先考虑
中国大陆长期逐日降水基准	CHM_PRE V2
与既有中国气候研究对齐	CN05.1、CMA 0.5°格点降水
小时级暴雨、内涝、山洪	CMPA、CLDAS-V2.0、IMERG、MSWEP
陆面、水文、生态模型驱动	CMFD 2.0、ERA5-Land
高空间分辨率制图	HRLT、CDMet
跨境流域或全球一致性	MSWEP、IMERG、CHIRPS、ERA5-Land
卫星降水产品对比	IMERG、GSMaP、CMORPH、PERSIANN-CDR

主要数据集对比

数据集	数据源入口	类型	覆盖与时段	分辨率	推荐用途	注意事项
CHM_PRE V2	TPDC DOI、Zenodo	中国大陆站点观测、协变量和机器学习融合	中国大陆；1960-2024，计划年更新	0.1°；日尺度；月/年汇总	中国大陆长期逐日降水、极端降水、水文模型基准	日尺度为主，不适合小时暴雨过程
CN05.1	中国气象数据网	中国站点插值格点	中国区域；常见版本多从 1961 年起	0.25°；日/月	气候变化、区域气候模式评估、与既有论文对齐	公开入口和版本年份需核对
CMA 0.5° V2.0 中国地面降水格点	中国气象数据网，常见代码 `SURF_CLI_CHN_PRE_DAY_GRID_0.5`、`SURF_CLI_CHN_PRE_MON_GRID_0.5`	官方站点插值产品	中国区域；常见为 1961 年以来	0.5°；日/月	官方基准、长期降水气候统计	分辨率偏粗，小流域和复杂地形不优先
HRLT	NCDC 页面、PANGAEA DOI	中国 1 km 逐日气温/降水插值	中国；1961-2019	1 km；日尺度	高分辨率空间格局、生态和农业分析	1 km 是统计插值/降尺度结果，不等同于 1 km 实测降雨
CDMet	Zenodo、Scientific Data	中国 4 km 多气象要素格点	中国大陆；2000-2020	约 4 km；日尺度	多变量生态、水文、农业模型输入	时间长度较短，小时过程不可用
CMFD 2.0	TPDC DOI、清华 DESS 说明	中国区域陆面气象强迫融合数据	70°E-140°E、15°N-55°N 陆地；1951-2024	0.1°；3 小时	陆面过程、水文和生态模型驱动	降水是融合强迫变量，不是纯观测格点
CLDAS-V2.0	CMA 知识服务页	CMA 陆面数据同化/融合产品	亚洲区域；近实时产品	0.0625°；1 小时	近实时监测、小时降水、业务分析	历史长度和访问权限需按 CMA 当前说明核对
CMPA / CMA 多源融合降水	中国气象数据网，常见入口如 `SURF_CMPA_RT_NC`	自动站、卫星或雷达等多源融合	中国区域；不同版本时段不同	常见 0.1°或 0.05°；1 小时	暴雨过程、卫星降水中国区验证基准	CMA 入口、数据代码和版本变化较多
GPM IMERG V07	NASA GPM 数据目录、GES DISC Final 30 min	全球多卫星降水，Final 产品含雨量站校正	全球；2000 年以来	0.1°；30 分钟、日、月	跨区域暴雨、洪水、卫星降水对比	中国山地、冷季、弱降水和极端峰值需校正
GSMaP	JAXA GSMaP Hourly、JAXA G-Portal	JAXA 全球多卫星降水	全球；1998 年以来	0.1°；1 小时	亚洲小时降水、台风和暴雨过程	仍是卫星反演，复杂地形偏差明显
MSWEP V3	GloH2O MSWEP	站点、卫星、再分析机器学习融合	全球；1979 年以来	0.1°；小时；近实时	全球一致性水文模拟、跨境流域、近实时分析	许可和使用场景需核对，国内研究仍建议本地站点验证
CHIRPS v3	UCSB CHIRPS v3、数据仓库	红外卫星和站点融合	陆地 60°S-60°N；1981 年至近实时	0.05°；日、候、旬、月、年	干旱、农业、水文气候监测	日尺度产品由候/月产品分配得到，不适合解释日内过程
ERA5-Land	Copernicus CDS	陆面再分析/模式产品	全球陆地；1950 年以来	约 0.1°；小时	多变量一致的模型驱动、干旱和洪水背景分析	降水是模式估计，不是直接观测；单位和累计方式要转换
CMORPH CDR	NOAA NCEI CMORPH	NOAA 卫星降水气候记录	全球；1998 年以来	约 8 km；30 分钟	卫星产品对比、短历时降水分析	中国区域通常需要站点校正
PERSIANN-CDR	NOAA NCEI PERSIANN-CDR	红外卫星和神经网络气候记录	60°S-60°N；1982 年以来	0.25°；日尺度	长时间序列、极端和干旱对比研究	分辨率较粗，中国精度通常不如本土站点融合产品
APHRODITE	APHRODITE 产品页、NCAR Climate Data Guide	亚洲雨量站插值	亚洲/季风亚洲；不同版本覆盖不同	0.25°/0.5°；日尺度	亚洲跨境流域、历史对比	站点密度随时空变化，趋势分析要谨慎
GPCC	DWD GPCC 下载入口	全球雨量站月降水格点	全球陆地；长期月尺度产品	0.25°、0.5°、1°、2.5°；月尺度	百年尺度气候背景、月降水基准	月尺度为主，不适合日/小时事件

按数据来源理解差异

1. 站点插值类

代表数据包括 CHM_PRE、CN05.1、CMA 0.5°格点降水、APHRODITE 和 GPCC。这类数据的优势是更接近地面雨量站观测，适合长期气候统计、日尺度降水、区域气候评估和论文中的基准对照。

它的主要问题是站点密度不均。在中国西部、高山峡谷、青藏高原边缘、沙漠和边境地区，网格值的可靠性会受到站点数量和插值方法影响。即使空间分辨率看起来很高，也不代表每个格网都有同等可信度。

2. 卫星反演类

代表数据包括 GPM IMERG、GSMaP、CMORPH 和 PERSIANN-CDR。这类产品覆盖广、时间分辨率高，特别适合暴雨过程、台风降雨、跨区域对比和缺站区域研究。

但卫星降水不是直接量雨。它依赖微波、红外等遥感信号反演，在复杂地形、冷季降雪、弱降水和强对流峰值上容易出现偏差。用于中国流域模型前，最好用本地雨量站或本土融合产品做校正。

3. 多源融合类

代表数据包括 CMFD、CLDAS、CMPA、MSWEP 和 CHIRPS。它们通常把站点、卫星、雷达、再分析或模式背景场结合起来，试图获得比单一数据源更稳定的结果。

融合产品要重点看三件事：是否使用了本地站点资料，时间延迟是否满足业务需求，目标变量是否是降水观测本身还是模型强迫变量。例如 CMFD 更适合作为陆面模型驱动，CMPA/CLDAS 更适合小时降水过程，MSWEP 更适合全球一致性水文模拟。

4. 再分析类

ERA5-Land 是最常见的再分析/陆面模式产品之一。它的优势是变量完整、时空连续、全球一致，适合需要温度、湿度、风、辐射、降水等多变量共同驱动的模型。

但再分析降水不是雨量站观测，也不是卫星直接反演结果，而是模式和同化系统输出。它适合做背景场、驱动场和跨变量一致分析，不宜未经校正就作为局地实测降雨替代。

典型场景怎么选

中国大陆长期逐日降水

首选 CHM_PRE V2。它覆盖 1960-2024 年，空间分辨率 0.1°，提供日尺度 NetCDF 以及月、年尺度 NetCDF/GeoTIFF 文件。对于年降水量、月降水距平、极端降水指数、SPI/SPEI 前处理和流域日降水序列，它比许多全球卫星产品更适合作为中国大陆基准。

如果要和早期论文或模式评估工作对齐，可以同时保留 CN05.1 或 CMA 0.5°格点降水作为敏感性对比。

小时级暴雨和城市内涝

不要用日尺度数据替代小时过程。城市内涝、山洪、短历时暴雨和台风降水过程更需要 1 小时或 30 分钟数据。国内业务和研究中可以优先查 CMPA、CLDAS-V2.0；跨区域或无 CMA 数据权限时，可考虑 IMERG、GSMaP、CMORPH 或 MSWEP。

需要注意，卫星小时降水常常能较好描述空间形态，但峰值强度、降水起止时间和山地降水仍需站点校正。

陆面、水文、生态模型

如果模型需要多个气象变量共同输入，可以优先考虑 CMFD 2.0 或 ERA5-Land。CMFD 更贴近中国及周边陆地区域应用，ERA5-Land 胜在全球一致性、变量完整和时间连续。

这类数据的降水变量更像“模型驱动用强迫数据”，而不是单独的降雨观测产品。做降水统计结论时，要把这一点写清楚。

农业干旱和季节监测

CHIRPS、MSWEP 和 CHM_PRE 都可以用于农业干旱、季节累计降水、降水距平和区域干湿变化。若研究区在中国大陆，CHM_PRE 更适合作为本土基准；如果研究区跨越多个国家或区域，CHIRPS 和 MSWEP 的全球一致性更方便。

高分辨率空间制图

HRLT 和 CDMet 的空间分辨率较高，适合做空间格局表达、生态环境分析、农业气候区划和地图制图。但高分辨率不等于高真实性，尤其不能把 1 km 或 4 km 的格点值理解成相应尺度上的真实雨量站观测。

使用前要检查的几个问题

时间尺度是否匹配：日尺度产品不能直接用于小时暴雨过程，月尺度产品不能用于单场洪水模拟。
空间分辨率是否真的有意义：统计降尺度得到的 1 km 数据，不代表 1 km 网格内有真实观测。
单位是否需要转换：常见单位包括 mm/day、mm/hour、mm/month、kg m-2 s-1、m 等，ERA5-Land 等产品尤其要注意累计量和单位转换。
缺失值和掩膜是否正确：NetCDF、GeoTIFF、HDF5 的缺失值编码不同，区域平均前应先处理无效值。
数据是否经过站点校正：Final、Late、Early、Near real-time 版本精度不同，不能混用。
许可是否允许当前用途：MSWEP、部分 CMA 数据和部分平台数据可能存在访问权限或使用限制，公开发表前应核对数据许可。

Python 读取示例

多数降雨栅格数据最终会以 NetCDF、GeoTIFF、HDF5 或 GRIB 形式提供。对于 NetCDF，可优先使用 xarray：

import xarray as xr

ds = xr.open_dataset("precipitation.nc")
print(ds)
prec = ds["prec"]

对于多个年度文件，可以用 open_mfdataset 延迟读取：

from pathlib import Path
import xarray as xr

paths = sorted(Path("daily").glob("*.nc"))
ds = xr.open_mfdataset(paths, chunks="auto", combine="by_coords")
prec = ds["prec"]

GeoTIFF 更适合 GIS 制图和空间叠加，可用 rioxarray 读取：

import rioxarray

raster = rioxarray.open_rasterio("precipitation.tif", masked=True)
print(raster.rio.crs)

实际处理时，建议先把研究区边界、时间范围、时间尺度和单位统一，再做统计分析。不要在没有单位转换和时间聚合说明的情况下，把多个数据集直接相减或求平均。

小结

降雨栅格数据没有绝对最优，只有适不适合当前问题。中国大陆长期逐日研究优先 CHM_PRE V2；小时级过程优先 CMPA、CLDAS、IMERG 或 MSWEP；多变量模型驱动优先 CMFD 或 ERA5-Land；跨境和全球对比优先 IMERG、MSWEP、CHIRPS 等全球产品。

真正可靠的做法，是先按研究目标选择候选数据，再用本地雨量站、流域出口径流、历史暴雨记录或已有权威产品进行交叉验证。对于降雨这种空间变异极强的变量，数据来源、尺度和误差结构往往比文件格式本身更重要。