

期刊名称:Earth System Science Data
论文题目:Spatial patterns of sandy beaches in China and risk analysis of human infrastructure squeeze based on multi-source data and ensemble learning
发表时间: 2025年12月12日
DOI:https://doi.org/10.5194/essd-17-7147-2025
数据集地址:https://doi.org/10.5281/zenodo.15307240
沙滩为生态和经济提供了重要的服务,但其功能正日益受到人类活动的威胁。对中国沙滩的空间分布以及人类活动影响的分析,为沿海资源管理和生态保护提供了宝贵的见解。然而,遥感技术面临着诸如数据源有限和潮汐影响等挑战,这些都影响了识别的准确性。因此,整合多源遥感数据并减少潮汐波动的影响以提高识别精度,仍是关键挑战。本研究提出了一种创新方法,利用多源数据和集成学习模型来识别中国(2016 - 2024 年)的沙滩。通过整合 Sentinel-1/2 卫星数据、地形数据和夜间灯光数据,并结合光谱、指数、地形、纹理和极化特征,对多年份的沙滩进行了识别,并将结果整合为一个独特的数据集,以分析空间格局和来自人类基础设施挤压的风险。(1)高精度分类识别出中国共有 3347 处沙滩,总面积达 320.50 平方千米。广东的沙滩数量最多、面积最大、周长最长,而河北的沙滩宽度最广。(2)在福建、广东和台湾,识别出的沙滩面积分别为 54.57、78.88 和 46.60 平方千米,周长分别为 1435.89、2849.39 和 1324.98 千米,宽度分别为 54.91、38.92 和 57.17 米。这些结果明显优于已发布的数据集。(3)从 1990 年到 2024 年,受人类基础设施挤压威胁的面积从 134.39 平方千米增加到 181.42 平方千米,增加了 47.03 平方千米,其中 1995 年至 2000 年期间增长最为显著。广东和福建的增长率分别为每年 0.38 平方千米和 0.32 平方千米。本研究提供了中国沙滩的最新数据集。它评估了沙滩的空间格局和人类影响风险,为沿海地区的可持续发展研究和政策制定做出了贡献。
中国拥有漫长的海岸线和丰富的沙滩资源。准确识别沙质海滩的空间分布、掌握其形态特征、评估人类活动对其挤压程度,对于海岸带资源管理、生态保护以及区域可持续发展规划具有重要的科学指导意义。然而,现有中国沙质海滩数据在完整性、现势性以及识别精度方面存在不足,特别是缺乏基于高分辨率、长时序多源数据的产品。本研究旨在弥补这一空白,为海岸带精细化管理提供数据支撑。
Sentinel-2影像(2016–2024年): 用于提取光谱(B2、B3、B4、B8、B11波段)及衍生指数特征,年度中值合成以减少云覆盖影响。
Sentinel-1 SAR数据(2016–2024年): VV与VH极化数据,提供地表纹理及极化特征。
NASADEM高程数据: 30米分辨率,重采样至10米,用于提取高程、坡度、坡向等地形特征。
VIIRS夜间灯光数据: 500米分辨率,重采样至10米,作为表征人类活动强度的代理变量。
中国土地覆盖数据集(CLCD,1990–2024年): 30米分辨率,从中提取不透水面数据,用于量化人类基础设施对沙滩的挤压风险。
Google Earth高分辨率影像: 作为训练样本标注和模型精度验证的“地面真值”。
对比数据集: 包括OpenStreetMap沙滩数据、基于Sentinel‑2与SVM方法生成的2022年中国10米沙滩数据集等,用于结果横向比较。
本研究构建了一个融合多源特征与堆叠集成学习模型的沙滩识别框架。首先,基于Google Earth影像目视解译生成覆盖不同地表类型的训练与验证样本库(共341,057个样本)。其次,从光谱、指数、地形、纹理及极化5个维度提取了24个输入特征。分类模型采用堆叠集成学习策略,以随机森林、梯度提升决策树、XGBoost和LightGBM作为基学习器,逻辑回归作为元学习器进行概率融合。模型输出后,通过空间滤波、连通性分析及手动边界细化等后处理步骤,得到最终的沙滩分布数据。最后,基于CLCD不透水面数据,建立100米缓冲区,与沙滩数据进行空间叠加,分析1990年至2024年间人类基础设施挤压风险的时空变化,并使用Sen's斜率法评估变化趋势。
研究识别出中国沿海地区在2016–2024年间共计有3347个沙质海滩,总长度约10,343.57千米,总面积约320.50平方千米,平均宽度为46.42米。空间分布呈现“南北多、中部少”的宏观格局。具体而言,广东省的沙滩数量(1096个)、总长度(2849.39千米)和总面积(78.88平方千米)均位居全国首位;而河北省的沙滩平均宽度最大,达到68.77米。
所构建的堆叠集成学习模型在2016至2024年各年的分类精度(Accuracy)、查准率(Precision)、召回率(Recall)、F1分数及AUC值均稳定高于0.85,表明模型具有较强的鲁棒性。与已有的OpenStreetMap沙滩数据、2022年SVM沙滩数据等三个公开数据集进行横向对比,本研究所产数据集在沙滩的面积、周长、宽度及数量等方面均表现出更高的准确性和可靠性,误分类现象和噪声图斑显著减少。
分析表明,1990年至2024年间,受人类基础设施挤压风险的沙滩面积从134.39平方千米增加至181.42平方千米,净增长约47.03平方千米。风险面积的增长并非匀速,其中1995年至2000年间增长最为显著。至2024年,风险面积最大的省份依次为广东(37.62平方千米)、山东(33.02平方千米)、台湾(32.52平方千米)和福建(32.13平方千米)。从变化趋势看,1990–2024年间广东和福建两省的风险面积年增长率最高,分别为0.38平方千米/年和0.32平方千米/年,但近年来整体增长速率有所放缓。






