欢迎光临散文网 会员登陆 & 注册

【花师小哲】面向一般大众的神经网络科普(3)-CV图像和其他

2022-10-15 16:22 作者:花师小哲-中二  | 我要投稿

这篇来讲讲神经网络在CV(机器视觉)和图像领域的应用。会涉及到大家可能比较关注的图像生成(但是只讲图像生成的一个祖宗,其他的我不太熟悉)。还会讲讲其他领域的应用。

 


3.CV+图像

3.1卷积CNN

卷积神经网络CNN是CV+图像领域最重要的神经网络之一。



图像不像是词语,我们是可以把二维的图像“摊平”成一维的数组进行输入的,但MLP的问题是我们一般认为数据之间是没有关系的,虽然隐层是会建立一些关系。和attention想法差不多,我们为什么不显式建立关系呢?

当然,这种关系不能像attention那样做,毕竟这样关系的数量级就N^4了。万幸的是,对人类视觉的研究表明人类是有“感受野”的,也就是人不仅会看一点,而是会看一片。这样我们就可以认为每个像素点是和周围的一些像素点是有关系的,为了计算这种关系,就引入了卷积:



卷积解释起来很麻烦的,简单来说,我们想要让输入图像和卷积核做一些运算,实际上输出的是“感受野”图像,即我们把原始图像的每个像素点和旁边的像素做了一定的操作得到输出。通常来说,输出是会变小的。

这个操作具体怎么做是由卷积核决定的,卷积核是需要训练的。

 

CNN还涉及到池化等问题,这里不展开讲,只需要了解CNN的思路是让像素点建立和其他像素点之间的关系就可以了。

 

3.2图像识别存在的问题

图像识别存在的问题很多,这里主要讲一个问题。这个问题实质上能为其他一些问题产生一定的启示,即神经网络到底是怎样看图像的。

看下面这张图:


对于熊猫这个图片,一开始神经网络表现得很好,认为这张图像是熊猫的概率是93%,但如果我们加一个很小的随机噪声,加上这个噪声后,人是看不到这两张图像有什么差别的,但神经网络会识别错误。

这也是我之前说过的,不要以人的思维去理解AI,对AI来说,图像只是一些数字罢了。

 

3.3生成对抗网络GAN

上面这个做法实际上是骗神经网络,让人来骗神经网络有点low,根据一切都可换成神经网络的思想,我们为何不用神经网络来骗神经网络呢?于是就有了生成对抗网络GAN。

GAN是非常经典的生成图像的模型,是图像生成的老祖宗级别的存在。



GAN有两个网络,一个是生成器Generator,另一个是判别器Discriminator

生成器的输入是随机噪声(目的是保证每次生成的图像不一样),生成的是图像(假图像),生成器的目的是为了生成像真图像的图像来骗过判别器;判别器的输入是图像,可以是假图像,也可以是真图像,判别器的目的就是判断输入图像的真假。

一开始,生成器生成的图像质量比较低,判别器一下就能判别出来,随着这两个网络进行对抗,最终生成器能生成很多以假乱真的图像。

 

4.神经网络与强化学习——PPO

强化学习也是很经典的机器学习方法。



强化学习是说,我们有一个智能体(agent),它会根据一些策略生成一些动作和环境(environment)进行交互,根据环境的反馈改进智能体的策略。

没错,把神经网络替换进去,这就是PPO(不展开讲)

 

5.图神经网络

神经网络不是黑盒嘛,不是没有知识嘛,那么什么是有知识的呢?没错,知识图谱


知识图谱实际上可以看做是概念形成的图

图神经网络的思想就是直接在图上跑神经网络。

方法还是很多的,例如我们可以在图上用类似于卷积的方式,或者把每个节点的边的信息做embedding加入到节点中。

attention实际上就等价于全连接图上的图神经网络。

图神经网络还算是很新兴的技术,但可能是神经网络一条很好的出路。

 

6.表格领域

虽然神经网络看上去很强大,但仍然有些领域很难啃下来,一个领域就是表格领域,也就是常说的“xgboost is all you need”的领域。

那么在表格领域到底是谁占据霸主地位呢?就是各种树模型,例如很基础的树模型——决策树


决策树就是根据特征进行选择,就是这样一个看上去比神经网络还要简单的方法确实非常强大,又有可解释性

一个可能的原因是,我们制作表格不是随便搜集数据的,属性选择本身就有很多人类经验,所以树模型就很强。

当然,并不是说神经网络不能在表格领域获得更好的性能,而是神经网络在训练时间、可解释性、使用方便性等方面都被树模型吊打,性能得到的提升也没有特别大,那么为什么不选择方便好用的树模型呢?

 


这样就简单过了一下,有很多都没有涉及到,但也能够帮助大家更好地理解神经网络。


【花师小哲】面向一般大众的神经网络科普(3)-CV图像和其他的评论 (共 条)

分享到微博请遵守国家法律