欢迎光临散文网 会员登陆 & 注册

样本少?训练难?试试遥感影像智能解译预训练模型

2023-08-18 09:38 作者:超图集团  | 我要投稿

深度学习技术在遥感影像解译领域的优势逐渐凸显,遥感影像解译工作越来越多地用到深度学习模型。训练一个理想的深度学习模型需要大量样本数据,而实际情况是用户往往没有足够的样本数据,难以开展遥感智能解译,或是只有少量样本数据,导致模型效果欠佳。预训练模型则是解决这一问题的有效工具。预训练模型是基于大量高质量的样本数据训练得到的深度学习模型,往往针对特定任务。例如提取特定地物(如提取耕地、建筑物)、区分特定地物类型(如土地利用/覆盖分类)、检测特定地物目标(如检测飞机、舰船)、检测特定地物的变化(如检测道路变化)。


SuperMap提供哪些预训练模型

  • 遥感影像解译预训练模型

模型训练不仅对训练数据有较高要求,还是一个极其消耗时间和计算资源的过程。为了降低用户使用成本,结合遥感影像解译的应用需求,SuperMap提供几个常用的预训练模型:城市建筑物提取模型、城市水体提取模型、耕地提取模型、大棚提取模型、飞机识别模型、舰船识别模型。这6个模型均适用于高分辨率可见光影像。

▲SuperMap遥感影像智能解译预训练模型


其中,城市建筑物提取模型和城市水体提取模型在此前V1版本基础上对模型结构和训练数据进行了优化,如城市建筑物提取模型使用了2023版本新增的SegFormer模型。SegFormer是将Transformers引入语义分割任务的产物,同时兼顾效果、效率、鲁棒性,是一个简单、高效但强大的语义分割框架。与使用SFNet模型训练的V1版本相比,提取效果有了较大改善。

▲城市建筑物提取模型V1与V2对比


  • SAM大模型

2023年4月,Meta发布了计算机视觉大模型Segment Anything Model(SAM)。该模型由超10亿标签训练,可以对图像进行一键分割,而图像分割是遥感智能解译的基础。

SAM具备免训练、高泛化的特点,然而,模型对图像进行的全要素分割并不具备语义信息。此外,其训练数据也非遥感垂直领域的数据集,在没有提示和交互下难以适应遥感多种尺度。因此,SuperMap采用目标检测+SAM分割的方案,即采用Cascade RCNN等目标检测算法提供目标框提示,再使用SAM生成每个目标的实例分割掩码。

▲SAM分割方案



预训练模型如何使用?

  • 即拿即用——免训练,省人工

对于“预先训练好的模型”,若应用场景适配,我们则可以直接将它应用到推理影像上,省去训练数据准备、制作和模型训练的复杂流程。只需要使用对应的模型推理工具,输入待推理影像和预训练模型,就可以将影像提取为解译结果。模型推理在SuperMap桌面端产品(SuperMap iDesktopX)、组件产品(SuperMap iObjects Python)和服务器产品(SuperMap iServer)中均可实现,可灵活选择单个影像文件、影像文件夹、镶嵌数据集、影像服务等多种输入形式,并支持指定范围推理。

▲“即拿即用”的预训练模型


  • 迁移学习——提高预训练模型泛化性

预训练模型聚焦遥感影像解译的常见地物目标,而在实际应用中,往往会出现更加聚焦的需求。例如目前提供的城市建筑物提取模型,对于城市背景下具有不同外形特征和分布特征的建筑物都有较好的提取效果;但对于城郊区域集中连片的小型建筑物,提取精度仍有提升空间。面对此类更加聚焦的应用需求,我们可以使用迁移学习。

迁移学习是机器学习的一个领域,它将从解决一个问题中获得的知识应用到另一个类似的问题中。对于上述例子,可以使用少量的城郊建筑物训练数据,通过迁移学习,对城市建筑物提取模型进行参数微调,获得新的城郊建筑物提取模型。相比于从零开始训练城郊建筑物提取模型,迁移学习所需要的训练数据更少,从而可以快速获得满足应用需求的新模型。

▲迁移学习过程


深度学习技术的使用,大大提升了遥感影像解译的效率,而深度学习模型训练所需的数据成本、时间成本和算力成本也是实际应用中难以忽视的问题。为了降低用户使用成本,SuperMap提供了面向遥感影像智能解译的预训练模型,除了本文介绍的6个常用模型,未来还将持续提供针对不同任务、不同地物目标的预训练模型,并对已有模型进行迭代优化,期望帮助更多用户高效地完成遥感影像解译任务。

作者 | 超图研究院遥感研发中心 汪雪淼


样本少?训练难?试试遥感影像智能解译预训练模型的评论 (共 条)

分享到微博请遵守国家法律