从计算机图像、深度学习和OpenCV开始(目录P7)
实例分割和语义分割
用于图像理解的算法主要有三种:
图像分类算法使您能够获得表示图像内容的单个标签。你可以把图像分类想象为将一张图像输入到网络中,并获得一张标签作为输出。
目标检测算法不仅能告诉你图像中是什么,还能告诉你给定目标在图像中的位置。因此,对象检测器接受单个输入图像,然后返回多个值作为输出。输出本身是一个值列表,包含(1)类标签和(2)特定对象在图像中位置的边界框(x,y)-坐标。
实例分割和语义分割使目标检测走得更远。实例/语义分割方法不是返回边界框坐标,而是生成像素级掩码,告诉我们(1)对象的类标签,(2)对象的边界框坐标,以及(3)属于对象的像素坐标。
这些分割算法是中级/高级技术,因此请务必阅读上面的深度学习部分,以确保您了解基础知识。
Step #1:配置开发环境(初级)
Step #2:分割与目标检测(中级)
Step #3:使用 Mask R-CNN(中级)
Step #4:使用OpenCV进行语义切分(中级)