【第六节】图像的基础操作
目标
获取像素值并修改
获取图像的属性(信息)
图像的ROI()
图像通道的拆份及合并
几乎所有这些操作与Numpy的关系都比与OpenCV的关系更加紧密,因此熟练Numpy可以帮助我们写出性能更好的代码。
1、获取并修改像素值
首先,我们需要读入一幅图像:
你可以根据像素的行和列的坐标获取他的像素值。对BGR图像而言,返回值为B,G,R的值。对灰度图像而言,会返回他的灰度值
你可以以类似的方式修改像素值
警告:Numpy是经过优化了的进行快速矩阵运算的软件包。所以我们不推荐逐个获取像素值并修改,这样会很慢,能有矩阵运算就不要用循环。
注意:上面提到的方法被用来选取矩阵的一个区域,比如说前5行的后3列。对于获取每一个像素值,也许使用Numpy的array.item() 和array.itemset()会更好。但是返回值是标量。如果你想获得所有B, G, R的值,你需要使用array.item()分割他们。
获取像素值及修改的更好方法:
2、获取图像属性
图像的属性包括:行,列,通道,图像数据类型,像素数目等
img.shape可以获取图像的形状。他的返回值是一个包含行数、列数、通道数的元组。
注意:如果图像是灰度图,返回值仅有行数和列数。所以通过检查这个返回值就可以知道加载的是灰度图还是彩色图。
img.size还可以返回图像的像素数目:
img.dtype返回的是图像的数据类型
注意:在debug时,img.dtype非常重要。因为在OpenCV-python中经常会出现数据类型的不一致。
3、图像的ROI
有时你需要对一幅图像的特定区域进行操作。例如我们要检测一副图像中眼睛的位置,我们首先应该在图像中找到脸,再在脸的区域中找眼睛,而不是直接在一幅图像中搜索。这样会提高程序的准确性和性能。
ROI也是使用Numpy索引来获得的。现在我们选择眼睛的部分并把他拷贝到图像的其他区域。
看看结果吧:

4、拆份及合并图像通道
有时我们需要对BGR三个通道分别进行操作。这是你就需要把BGR拆分成单个通道。有时你需要把独立通道的图片合并成一个BGR图像。你可以这样做:
或者
假如你想使所有像素的红色通道值都为0,你不必拆分在赋值。可以直接使用Numpy索引,这会更快。
警告:CV2.split()是一个比较耗时的操作。只有真正需要时才用它,能用Numpy索引就尽量用。
5、为图像扩边(填充)
如果你想在图像周围创建一个边 ,就像相框一样,你可以使用CV2.copyMakeBorder()函数。这经常在卷积运算或0填充时被用到。这个函数包括如下参数:
src输入图像
top, bottom, left, right对应边界的像素数目。
borderType要添加那种类型的边界,类型如下
- CV2.BORDER_ CONSTANT添加有颜色的常数值边界,还需要下一个参数( value )。
- CV2.BORDER_ REFLECT边界元素的镜像。比如: fedcba|abcde-fgh|hgfedcb
- CV2.BORDER_ REFLECT_ 101 or CV2.BORDER_ DEFAULT跟上面一样,但稍作改 动。例如: gfedcb|abcdefgh|gfedcba
- CV2.BORDER REPLICATE重复最后一个元素。例如: aaaaaa|
abcdefgh|hhhhhhh
- CV2.BORDER _WRAP不知道怎么说了,就像这样: cdefgh|abcdefghlabcdefg
value边界颜色,如果边界的类型是CV2.BORDER CONSTANT
为了更好理解这几种类型,请看下面的演示程序。
结果如下(由于是使用matplotlib绘制,所以交换R和B的位置,OpenCV中是按BGR, matplotlib 中是按RGB排列):

上图效果看的可能不清晰,换一个图片再看看:
