欢迎光临散文网 会员登陆 & 注册

【第六节】图像的基础操作

2022-11-16 12:57 作者:海鸥之道  | 我要投稿

目标

  • 获取像素值并修改

  • 获取图像的属性(信息)

  • 图像的ROI()

  • 图像通道的拆份及合并

几乎所有这些操作与Numpy的关系都比与OpenCV的关系更加紧密,因此熟练Numpy可以帮助我们写出性能更好的代码。

1、获取并修改像素值

首先,我们需要读入一幅图像:

        你可以根据像素的行和列的坐标获取他的像素值。对BGR图像而言,返回值为B,G,R的值。对灰度图像而言,会返回他的灰度值

你可以以类似的方式修改像素值

警告:Numpy是经过优化了的进行快速矩阵运算的软件包。所以我们不推荐逐个获取像素值并修改,这样会很慢,能有矩阵运算就不要用循环。

注意:上面提到的方法被用来选取矩阵的一个区域,比如说前5行的后3列。对于获取每一个像素值,也许使用Numpy的array.item() 和array.itemset()会更好。但是返回值是标量。如果你想获得所有B, G, R的值,你需要使用array.item()分割他们。

获取像素值及修改的更好方法:

2、获取图像属性

        图像的属性包括:行,列,通道,图像数据类型,像素数目等

img.shape可以获取图像的形状。他的返回值是一个包含行数、列数、通道数的元组。

注意:如果图像是灰度图,返回值仅有行数和列数。所以通过检查这个返回值就可以知道加载的是灰度图还是彩色图。

img.size还可以返回图像的像素数目:

img.dtype返回的是图像的数据类型

注意:在debug时,img.dtype非常重要。因为在OpenCV-python中经常会出现数据类型的不一致。

3、图像的ROI

        有时你需要对一幅图像的特定区域进行操作。例如我们要检测一副图像中眼睛的位置,我们首先应该在图像中找到脸,再在脸的区域中找眼睛,而不是直接在一幅图像中搜索。这样会提高程序的准确性和性能。

        ROI也是使用Numpy索引来获得的。现在我们选择眼睛的部分并把他拷贝到图像的其他区域。

看看结果吧:

4、拆份及合并图像通道

        有时我们需要对BGR三个通道分别进行操作。这是你就需要把BGR拆分成单个通道。有时你需要把独立通道的图片合并成一个BGR图像。你可以这样做:

或者

        假如你想使所有像素的红色通道值都为0,你不必拆分在赋值。可以直接使用Numpy索引,这会更快。

警告:CV2.split()是一个比较耗时的操作。只有真正需要时才用它,能用Numpy索引就尽量用。

5、为图像扩边(填充)

        如果你想在图像周围创建一个边 ,就像相框一样,你可以使用CV2.copyMakeBorder()函数。这经常在卷积运算或0填充时被用到。这个函数包括如下参数:

  • src输入图像

  • top, bottom, left, right对应边界的像素数目。

  • borderType要添加那种类型的边界,类型如下

            - CV2.BORDER_ CONSTANT添加有颜色的常数值边界,还需要下一个参数( value )。

            - CV2.BORDER_ REFLECT边界元素的镜像。比如: fedcba|abcde-fgh|hgfedcb

            - CV2.BORDER_ REFLECT_ 101 or CV2.BORDER_ DEFAULT跟上面一样,但稍作改              动。例如: gfedcb|abcdefgh|gfedcba

            - CV2.BORDER REPLICATE重复最后一个元素。例如: aaaaaa|

            abcdefgh|hhhhhhh

            - CV2.BORDER _WRAP不知道怎么说了,就像这样: cdefgh|abcdefghlabcdefg

  • value边界颜色,如果边界的类型是CV2.BORDER CONSTANT

为了更好理解这几种类型,请看下面的演示程序。

结果如下(由于是使用matplotlib绘制,所以交换R和B的位置,OpenCV中是按BGR, matplotlib 中是按RGB排列):

上图效果看的可能不清晰,换一个图片再看看:




【第六节】图像的基础操作的评论 (共 条)

分享到微博请遵守国家法律