近日,72886必赢欢迎光临黄金良教授课题组在国际期刊Journal of Hydrology上在线发表了题为“Improving daily streamflow simulations for data-scarce watersheds using the coupled SWAT-LSTM approach”的研究论文。研究构建了耦合流域过程模型(SWAT)与机器学习算法(LSTM)的方法,展现了其在无资料及缺资料流域逐日径流模拟方面的应用潜力。
01.研究背景
径流量是陆地水循环的基本指标,可获取的径流数据对于洪水/干旱风险评估、可持续水资源管理至关重要。然而,全球径流数据可获得性存在明显的区域差异。除美国和欧洲部分地区外,许多流域由于缺乏径流监测网络或监测工作起步较晚,导致径流数据有限(缺资料流域)、甚至没有数据(无资料流域)。与数据丰富流域相比,这些数据稀缺流域同样需要充足的径流数据来支撑水资源管理。模型模拟获取径流数据是水文学领域的重要方式。但在数据稀缺流域,单独使用两种常用的建模方法,即:过程模型和机器学习模型,难以获取令人满意的长时间序列径流数据以供模型校验及后续应用。
本研究构建了一个耦合建模方法,通过将过程模型SWAT和可解释机器学习模型LSTM相结合,应用于无资料流域和缺资料流域逐日径流量模拟,并在福建省25个水文站点评估该方法的表现。本研究旨在解决两个问题:(1)基于机器学习模型的视角,流域过程中径流变化的关键驱动因素是什么?(2) 在数据稀缺流域,过程模型和机器学习模型的耦合是否能带来令人满意的径流模拟表现?这项研究展示了本耦合建模方法可有效地模拟数据稀缺流域逐日径流,极具应用潜力。
02.研究结果
该研究利用SWAT模型生成长时间序列的流域水文相关数据,包括地表径流、地下径流、侧向流、下渗、蒸散发等,连同降雨、气温等气象数据作为LSTM模型的输入。先在数据丰富流域--九龙江北溪流域建立预训练模型。利用北溪流域出口--浦南站的实测径流数据作对比,测试期SWAT-LSTM获得的纳什效率系数(NSE)为0.885。利用SHAP评估了流域输入特征对模拟径流的重要性,发现降雨是最重要的驱动因素,侧向流和地下径流次之。构建的预训练模型之后被应用至福建省内24个无资料流域,NSE为0.474~0.898,平均为0.685。预训练模型被应用至缺资料流域时,通过引入迁移学习技术,用当地少量径流数据(本研究假定为所拥有资料的前5%)对预训练模型进行优化微调,NSE为0.591~0.918,平均为0.760。本研究还讨论了在源域选择(提供预训练模型的数据丰富流域)的有效方法,发现同时考虑空间邻近性和物理相似性可以进一步提升模拟精度。
图1 研究区域
图2 数据丰富流域中SWAT-LSTM和经率定验证的SWAT模型精度对比
图3 SHAP解释结果
图4 SWAT-LSTM在无资料流域的表现差异及其不确定性分析
图5 SWAT-LSTM在缺资料流域的表现
图6 不同源域选择方法对模拟精度的影响
03.研究团队
论文第一作者为72886必赢欢迎光临2021级环境管理专业博士研究生陈胜粤,台湾大学地理系黄志川教授也参与该研究,论文通讯作者为黄金良教授。该研究得到了国家自然科学基金(No.41971231)的资助。
论文来源:https://www.sciencedirect.com/science/article/pii/S0022169423006765
Chen S, Huang J, Huang J C. Improving daily streamflow simulations for data-scarce watersheds using the coupled SWAT-LSTM approach[J]. Journal of Hydrology, 2023: 129734.
文、图 | 陈胜粤
责任编辑 | 黄金良