深度学习多模态情感识别科研论文小班第2期
# 查找标签中的每个像素的类索引,如果说每次都遍历数组的话是一件非常耗时的事情# 所以这里构建了一个类似dictionary的数组# 下标:256颜色,值:对应的labeldef voc_colormap2label():
"""构建从RGB到VOC类别索引的映射"""
# 一维向量
colormap2label = torch.zeros(256**3,dtype=torch.long)
for i, colormap in enumerate(VOC_COLORMAP):
# 这就是256进制转十进制,可以这么理解
colormap2label[(colormap[0]*256+colormap[1])*256 + colormap[2]] = i return colormap2label# 这里是给你一个分类后的像素点,获取labeldef voc_label_indices(colormap, colormap2label):
"""将VOC标签中的RGB值映射到他们的类别索引"""
# 因为一般卷积的输入都是,通道x高x宽,图象是高x宽x通道,这里把卷积输入的格式变成图象格式
colormap = colormap.permute(1,2,0).numpy().astype('int32')
# print(colormap.shape) # (281, 500, 3),方便计算下标
idx = ((colormap[:, :, 0] * 256 + colormap[:, :, 1]) * 256 + colormap[:, :, 2])
# print(idx.shape) # (281, 500)