希腊地中海大学-AIFloodSense:面向全球洪水环境语义分割与智能理解的多任务航空影像数据集(数据集公开) MDPI Remote Sensing。论文标题:AIFloodSense: A Global Aerial Imagery Dataset for Semantic Segmentation and Understanding of Flooded Environments
论文链接:https://www.mdpi.com/2072-4292/18/6/938
期刊名:Remote Sensing
期刊主页:https://www.mdpi.com/journal/remotesensing
随着气候变化与城市化加速,洪水灾害频发,对快速精准的灾情评估提出了更高要求。无人机航拍影像因灵活、高分辨率且能呈现三维现场信息,已成为灾后应急响应的关键工具。然而,现有公开数据集多存在地理覆盖狭窄、时间陈旧、视角单一(仅限垂直俯拍)或标注粒度不足等问题,严重制约了深度学习模型在真实复杂场景中的泛化能力。针对这一瓶颈,希腊地中海大学的Costas Panagiotakis教授及其研究团队在Remote Sensing期刊发表最新成果,推出AIFloodSense数据集—一个覆盖全球、面向洪水环境理解的多任务基准数据集,为构建真正"鲁棒且可迁移"的洪水智能监测AI系统提供了关键支撑。

图1. 在所提出的数据集中,洪水事件图像的分布情况覆盖了 64 个国家,这些图像按总图像数量从多到少依次排列。训练样本用蓝色表示,测试样本用红色表示,这突出了每个国家对数据集的相对贡献。
研究过程与结果
AIFloodSense在时空覆盖与任务多样性上实现了显著突破。数据集涵盖470张高分辨率斜视角航空影像,捕捉了2022至2024年间发生于64个国家、六大洲的230个独立洪水事件,平均分辨率约190万像素。与现有资源不同,该数据集专门采集无人机斜视角(鸟瞰斜视)影像,与第一响应人员的实际操作视角高度一致,能提供水面与建筑立面的三维空间关系及关键水位信息,具有更强的现场决策价值。

图2.标注协议的流程图概述:(A)分类与语义分割;(B)视觉问答(VQA)。用于分类标签和分割类别的缩写:R(农村)、UP(城市/近郊)、SAb(无天空)、SP(有天空)、AF(非洲)、AS(亚洲)、EU(欧洲)、NA(北美洲)、OC(大洋洲)、SA(南美洲)、Build(建筑物)、Bgr(背景)。
在标注层面,研究团队采用严格的两阶段质控流程:三名标注员进行初始像素级标注与场景分类,再由两名高级审核员迭代校验。最终,每张影像均配备了四个语义分割类别(洪水、天空、建筑、背景)的精确掩膜,以及三类图像级标签(乡村/城市-近郊、有无天空、所属大洲)。此外,数据集还创新性地支持视觉问答(VQA)任务,涵盖建筑物数量、城乡判断、天空可见性、洪水存在性及淹没建筑计数等五个核心问题,实现了从底层像素感知到高层语义推理的跨越。
为验证数据集价值,作者对分类、语义分割与VQA三项任务进行了系统基线实验。在分类任务中,预训练的Vision Transformer在"乡村 vs. 城市/近郊"识别上取得最优F1分数(85.07%);而在更具挑战性的"大洲识别"任务中,尽管预训练显著优于从头训练,整体准确率仍仅约54%,充分证明数据集蕴含的全球地理多样性对现有模型构成了实质性挑战,绝非简单的纹理记忆所能解决。
语义分割实验显示,基于Swin Transformer的模型表现最为均衡,多类分割mIoU达78.75%。其中"天空"类因颜色特征鲜明最易分割(IoU超93%),而"建筑物"类因建筑风格、屋顶材质及淹没程度差异巨大,成为最具挑战性的类别(IoU约63%)。更具说服力的是跨数据集泛化实验:作者将AIFloodSense(470张)与规模近5倍的FloodNet(2343张)进行对比,在独立的FAD和FSSD测试集上评估发现,基于AIFloodSense训练的模型泛化性能显著优于基于FloodNet训练的模型——Swin-T在FAD上的IoU从49.92%跃升至84.08%,在FSSD上从43.59%提升至92.08%。这一结果强有力地验证了作者的核心假设:对于洪水检测模型,数据的地理多样性与场景异质性远比单纯的规模扩张更为关键。
研究团队还开展了"留一洲交叉验证"域泛化研究。结果显示,当非洲作为未见测试域时,模型性能出现明显下降(IoU降至约82%),这主要源于非洲地区独特的乡土建筑风貌、非铺装路面及洪水与泥泞地表极低的光谱对比度。该发现深刻揭示了当前模型在面向发展中国家特殊地貌时的脆弱性,也反向证明了AIFloodSense纳入全球多元拓扑结构的必要性。
在VQA任务中,经过微调的BLIP-2与LLaMA 3.2 Vision等现代多模态大模型在环境分类与洪水存在性判断上表现优异(部分指标达100%),但在密集建筑计数任务上仍面临显著挑战,Gemini 2.5 Flash以最低的RMSE(7.64)领先。这表明,实例级空间推理与精确计数仍是灾后航空分析中亟待攻克的开放难题。
研究总结
本文介绍的AIFloodSense数据集及其多任务基准测试框架,为全球洪水监测研究填补了关键空白。通过提供覆盖六大洲、230个独立事件、具备像素级精细标注与多模态问答能力的斜视角航空影像资源,该研究不仅为语义分割、域泛化和视觉语言推理等前沿方向提供了严格的"压力测试"平台,更以跨数据集实验实证了"质量优于数量"的数据集构建范式。
作者详细探讨了模型在跨大陆迁移、城乡环境判别及淹没建筑计数等任务中的不确定性来源与失效模式,指出当前算法仍高度依赖迁移学习,且在处理全球极端多样的建筑形态与地表特征时存在明显短板。未来,研究团队计划进一步融合多光谱与热红外数据,并整合实时文本、气象与地形信息,构建真正的多模态灾害评估框架。AIFloodSense的公开发布,将有力推动面向气候韧性的域泛化AI工具研发,助力全球灾害响应从"数据饥渴"走向"精准智能"的新阶段。
AIFloodSense 数据集可在以下网址获取:https://doi.org/10.34740/kaggle/dsv/14253970 。
Remote Sensing期刊介绍
主编:Prasad S. Thenkabail, USGS Western Geographic Science Center (WGSC), USA;
Dongdong Wang, Peking University, China
期刊范围涵盖遥感科学所有领域,从传感器的设计、验证和校准,到遥感在地球科学、环境生态、城市建筑等各方面的广泛应用。
2025 Impact Factor 4.3 2025 CiteScore 9.4 Time to First Decision 24.3 Days Acceptance to Publication 2.6 Days
来源:Remote Sensing

