为什么要关注降雨栅格数据
降雨数据最常见的原始形态是雨量站观测记录,但水文模拟、气候变化分析、洪涝风险评估、农业干旱监测和 GIS 制图通常需要连续空间面的输入,这就需要把点状观测、卫星反演、雷达估计、再分析资料或多源融合结果转换为规则网格,也就是常说的降雨栅格数据集或降水格点产品。
这类数据看起来都是一张张降雨量栅格图,但来源差异很大。站点插值产品更接近地面观测,卫星产品覆盖广且时间分辨率高,再分析产品变量体系完整,多源融合产品则试图在精度、覆盖范围和时效之间折中。选错数据,后续模型结果、极端降雨统计和空间制图都会出现明显偏差。
本文按“实际研究中如何选择”的角度,梳理中国及全球常用降雨栅格数据集。
先看结论
如果只做中国大陆长期逐日降水分析,优先看 CHM_PRE V2。如果研究对象是小时级暴雨、城市内涝、山洪或台风降雨过程,应优先考虑 CMPA、CLDAS-V2.0、GPM IMERG、GSMaP、MSWEP 这类小时或半小时产品。若研究跨境流域、全球对比或没有本地站点资料,则可以选 IMERG、MSWEP、CHIRPS、ERA5-Land 等全球一致性产品。
一个简单判断规则是:
| 需求 | 优先考虑 |
|---|---|
| 中国大陆长期逐日降水基准 | CHM_PRE V2 |
| 与既有中国气候研究对齐 | CN05.1、CMA 0.5°格点降水 |
| 小时级暴雨、内涝、山洪 | CMPA、CLDAS-V2.0、IMERG、MSWEP |
| 陆面、水文、生态模型驱动 | CMFD 2.0、ERA5-Land |
| 高空间分辨率制图 | HRLT、CDMet |
| 跨境流域或全球一致性 | MSWEP、IMERG、CHIRPS、ERA5-Land |
| 卫星降水产品对比 | IMERG、GSMaP、CMORPH、PERSIANN-CDR |
主要数据集对比
| 数据集 | 数据源入口 | 类型 | 覆盖与时段 | 分辨率 | 推荐用途 | 注意事项 |
|---|---|---|---|---|---|---|
| CHM_PRE V2 | TPDC DOI、Zenodo | 中国大陆站点观测、协变量和机器学习融合 | 中国大陆;1960-2024,计划年更新 | 0.1°;日尺度;月/年汇总 | 中国大陆长期逐日降水、极端降水、水文模型基准 | 日尺度为主,不适合小时暴雨过程 |
| CN05.1 | 中国气象数据网 | 中国站点插值格点 | 中国区域;常见版本多从 1961 年起 | 0.25°;日/月 | 气候变化、区域气候模式评估、与既有论文对齐 | 公开入口和版本年份需核对 |
| CMA 0.5° V2.0 中国地面降水格点 | 中国气象数据网,常见代码 SURF_CLI_CHN_PRE_DAY_GRID_0.5、SURF_CLI_CHN_PRE_MON_GRID_0.5 | 官方站点插值产品 | 中国区域;常见为 1961 年以来 | 0.5°;日/月 | 官方基准、长期降水气候统计 | 分辨率偏粗,小流域和复杂地形不优先 |
| HRLT | NCDC 页面、PANGAEA DOI | 中国 1 km 逐日气温/降水插值 | 中国;1961-2019 | 1 km;日尺度 | 高分辨率空间格局、生态和农业分析 | 1 km 是统计插值/降尺度结果,不等同于 1 km 实测降雨 |
| CDMet | Zenodo、Scientific Data | 中国 4 km 多气象要素格点 | 中国大陆;2000-2020 | 约 4 km;日尺度 | 多变量生态、水文、农业模型输入 | 时间长度较短,小时过程不可用 |
| CMFD 2.0 | TPDC DOI、清华 DESS 说明 | 中国区域陆面气象强迫融合数据 | 70°E-140°E、15°N-55°N 陆地;1951-2024 | 0.1°;3 小时 | 陆面过程、水文和生态模型驱动 | 降水是融合强迫变量,不是纯观测格点 |
| CLDAS-V2.0 | CMA 知识服务页 | CMA 陆面数据同化/融合产品 | 亚洲区域;近实时产品 | 0.0625°;1 小时 | 近实时监测、小时降水、业务分析 | 历史长度和访问权限需按 CMA 当前说明核对 |
| CMPA / CMA 多源融合降水 | 中国气象数据网,常见入口如 SURF_CMPA_RT_NC | 自动站、卫星或雷达等多源融合 | 中国区域;不同版本时段不同 | 常见 0.1°或 0.05°;1 小时 | 暴雨过程、卫星降水中国区验证基准 | CMA 入口、数据代码和版本变化较多 |
| GPM IMERG V07 | NASA GPM 数据目录、GES DISC Final 30 min | 全球多卫星降水,Final 产品含雨量站校正 | 全球;2000 年以来 | 0.1°;30 分钟、日、月 | 跨区域暴雨、洪水、卫星降水对比 | 中国山地、冷季、弱降水和极端峰值需校正 |
| GSMaP | JAXA GSMaP Hourly、JAXA G-Portal | JAXA 全球多卫星降水 | 全球;1998 年以来 | 0.1°;1 小时 | 亚洲小时降水、台风和暴雨过程 | 仍是卫星反演,复杂地形偏差明显 |
| MSWEP V3 | GloH2O MSWEP | 站点、卫星、再分析机器学习融合 | 全球;1979 年以来 | 0.1°;小时;近实时 | 全球一致性水文模拟、跨境流域、近实时分析 | 许可和使用场景需核对,国内研究仍建议本地站点验证 |
| CHIRPS v3 | UCSB CHIRPS v3、数据仓库 | 红外卫星和站点融合 | 陆地 60°S-60°N;1981 年至近实时 | 0.05°;日、候、旬、月、年 | 干旱、农业、水文气候监测 | 日尺度产品由候/月产品分配得到,不适合解释日内过程 |
| ERA5-Land | Copernicus CDS | 陆面再分析/模式产品 | 全球陆地;1950 年以来 | 约 0.1°;小时 | 多变量一致的模型驱动、干旱和洪水背景分析 | 降水是模式估计,不是直接观测;单位和累计方式要转换 |
| CMORPH CDR | NOAA NCEI CMORPH | NOAA 卫星降水气候记录 | 全球;1998 年以来 | 约 8 km;30 分钟 | 卫星产品对比、短历时降水分析 | 中国区域通常需要站点校正 |
| PERSIANN-CDR | NOAA NCEI PERSIANN-CDR | 红外卫星和神经网络气候记录 | 60°S-60°N;1982 年以来 | 0.25°;日尺度 | 长时间序列、极端和干旱对比研究 | 分辨率较粗,中国精度通常不如本土站点融合产品 |
| APHRODITE | APHRODITE 产品页、NCAR Climate Data Guide | 亚洲雨量站插值 | 亚洲/季风亚洲;不同版本覆盖不同 | 0.25°/0.5°;日尺度 | 亚洲跨境流域、历史对比 | 站点密度随时空变化,趋势分析要谨慎 |
| GPCC | DWD GPCC 下载入口 | 全球雨量站月降水格点 | 全球陆地;长期月尺度产品 | 0.25°、0.5°、1°、2.5°;月尺度 | 百年尺度气候背景、月降水基准 | 月尺度为主,不适合日/小时事件 |
按数据来源理解差异
1. 站点插值类
代表数据包括 CHM_PRE、CN05.1、CMA 0.5°格点降水、APHRODITE 和 GPCC。这类数据的优势是更接近地面雨量站观测,适合长期气候统计、日尺度降水、区域气候评估和论文中的基准对照。
它的主要问题是站点密度不均。在中国西部、高山峡谷、青藏高原边缘、沙漠和边境地区,网格值的可靠性会受到站点数量和插值方法影响。即使空间分辨率看起来很高,也不代表每个格网都有同等可信度。
2. 卫星反演类
代表数据包括 GPM IMERG、GSMaP、CMORPH 和 PERSIANN-CDR。这类产品覆盖广、时间分辨率高,特别适合暴雨过程、台风降雨、跨区域对比和缺站区域研究。
但卫星降水不是直接量雨。它依赖微波、红外等遥感信号反演,在复杂地形、冷季降雪、弱降水和强对流峰值上容易出现偏差。用于中国流域模型前,最好用本地雨量站或本土融合产品做校正。
3. 多源融合类
代表数据包括 CMFD、CLDAS、CMPA、MSWEP 和 CHIRPS。它们通常把站点、卫星、雷达、再分析或模式背景场结合起来,试图获得比单一数据源更稳定的结果。
融合产品要重点看三件事:是否使用了本地站点资料,时间延迟是否满足业务需求,目标变量是否是降水观测本身还是模型强迫变量。例如 CMFD 更适合作为陆面模型驱动,CMPA/CLDAS 更适合小时降水过程,MSWEP 更适合全球一致性水文模拟。
4. 再分析类
ERA5-Land 是最常见的再分析/陆面模式产品之一。它的优势是变量完整、时空连续、全球一致,适合需要温度、湿度、风、辐射、降水等多变量共同驱动的模型。
但再分析降水不是雨量站观测,也不是卫星直接反演结果,而是模式和同化系统输出。它适合做背景场、驱动场和跨变量一致分析,不宜未经校正就作为局地实测降雨替代。
典型场景怎么选
中国大陆长期逐日降水
首选 CHM_PRE V2。它覆盖 1960-2024 年,空间分辨率 0.1°,提供日尺度 NetCDF 以及月、年尺度 NetCDF/GeoTIFF 文件。对于年降水量、月降水距平、极端降水指数、SPI/SPEI 前处理和流域日降水序列,它比许多全球卫星产品更适合作为中国大陆基准。
如果要和早期论文或模式评估工作对齐,可以同时保留 CN05.1 或 CMA 0.5°格点降水作为敏感性对比。
小时级暴雨和城市内涝
不要用日尺度数据替代小时过程。城市内涝、山洪、短历时暴雨和台风降水过程更需要 1 小时或 30 分钟数据。国内业务和研究中可以优先查 CMPA、CLDAS-V2.0;跨区域或无 CMA 数据权限时,可考虑 IMERG、GSMaP、CMORPH 或 MSWEP。
需要注意,卫星小时降水常常能较好描述空间形态,但峰值强度、降水起止时间和山地降水仍需站点校正。
陆面、水文、生态模型
如果模型需要多个气象变量共同输入,可以优先考虑 CMFD 2.0 或 ERA5-Land。CMFD 更贴近中国及周边陆地区域应用,ERA5-Land 胜在全球一致性、变量完整和时间连续。
这类数据的降水变量更像“模型驱动用强迫数据”,而不是单独的降雨观测产品。做降水统计结论时,要把这一点写清楚。
农业干旱和季节监测
CHIRPS、MSWEP 和 CHM_PRE 都可以用于农业干旱、季节累计降水、降水距平和区域干湿变化。若研究区在中国大陆,CHM_PRE 更适合作为本土基准;如果研究区跨越多个国家或区域,CHIRPS 和 MSWEP 的全球一致性更方便。
高分辨率空间制图
HRLT 和 CDMet 的空间分辨率较高,适合做空间格局表达、生态环境分析、农业气候区划和地图制图。但高分辨率不等于高真实性,尤其不能把 1 km 或 4 km 的格点值理解成相应尺度上的真实雨量站观测。
使用前要检查的几个问题
- 时间尺度是否匹配:日尺度产品不能直接用于小时暴雨过程,月尺度产品不能用于单场洪水模拟。
- 空间分辨率是否真的有意义:统计降尺度得到的 1 km 数据,不代表 1 km 网格内有真实观测。
- 单位是否需要转换:常见单位包括 mm/day、mm/hour、mm/month、kg m-2 s-1、m 等,ERA5-Land 等产品尤其要注意累计量和单位转换。
- 缺失值和掩膜是否正确:NetCDF、GeoTIFF、HDF5 的缺失值编码不同,区域平均前应先处理无效值。
- 数据是否经过站点校正:Final、Late、Early、Near real-time 版本精度不同,不能混用。
- 许可是否允许当前用途:MSWEP、部分 CMA 数据和部分平台数据可能存在访问权限或使用限制,公开发表前应核对数据许可。
Python 读取示例
多数降雨栅格数据最终会以 NetCDF、GeoTIFF、HDF5 或 GRIB 形式提供。对于 NetCDF,可优先使用 xarray:
import xarray as xr
ds = xr.open_dataset("precipitation.nc")
print(ds)
prec = ds["prec"]
对于多个年度文件,可以用 open_mfdataset 延迟读取:
from pathlib import Path
import xarray as xr
paths = sorted(Path("daily").glob("*.nc"))
ds = xr.open_mfdataset(paths, chunks="auto", combine="by_coords")
prec = ds["prec"]
GeoTIFF 更适合 GIS 制图和空间叠加,可用 rioxarray 读取:
import rioxarray
raster = rioxarray.open_rasterio("precipitation.tif", masked=True)
print(raster.rio.crs)
实际处理时,建议先把研究区边界、时间范围、时间尺度和单位统一,再做统计分析。不要在没有单位转换和时间聚合说明的情况下,把多个数据集直接相减或求平均。
小结
降雨栅格数据没有绝对最优,只有适不适合当前问题。中国大陆长期逐日研究优先 CHM_PRE V2;小时级过程优先 CMPA、CLDAS、IMERG 或 MSWEP;多变量模型驱动优先 CMFD 或 ERA5-Land;跨境和全球对比优先 IMERG、MSWEP、CHIRPS 等全球产品。
真正可靠的做法,是先按研究目标选择候选数据,再用本地雨量站、流域出口径流、历史暴雨记录或已有权威产品进行交叉验证。对于降雨这种空间变异极强的变量,数据来源、尺度和误差结构往往比文件格式本身更重要。


评论区