欢迎光临散文网 会员登陆 & 注册

基于深度学习的电熔镁炉工况智能诊断

2023-03-10 10:45 作者:永远的修伊  | 我要投稿

1.     引言

电熔镁砂(Fused magnesium furnace,FMF)熔点高、抗氧化、耐腐蚀性强,是一种优良的耐高温化工材料,应用前景广阔,在现代工业中有着举足轻重的地位[1]。目前,我国电熔镁砂的工艺流程主要是以菱镁矿石通过三相交流电熔镁炉(简称电熔镁炉)进行加热熔炼来生产制备[2]。熔炼期间,由于原料杂质成分导致局部熔点升高,以及不适当的电流设定值使局部熔炼区温度低于原料熔化温度,设备容易发生欠烧工况。欠烧工况发生时,高温溶液容易穿透炉壳保护层与铁质炉壳直接接触,造成炉壳温度过高至烧红烧透,若处理不及时会造成设备烧漏、溶液溢出。目前,由于超高温电熔镁炉熔液温度不直接可测,欠烧异常工况主要通过现场工人定期观察炉壳特征来诊断。但人工巡检工作强度大、危险性高,且准确性高度依赖操作人员的经验和状态,滞后性大, 处理不及时会导致漏检[3]。因此,亟需一种自动且快速有效的电熔镁炉工况诊断方法。

针对以上问题,本文使用一种基于深度卷积神经网络的电熔镁炉欠烧工况识别技术,对欠烧工况进行智能识别分类,并在简单电熔镁炉工况数据集SAPI-FMF。SAPI-FMF数据集源自工业相机录制的同一批炉次下的炉况实际运行的视频片段中经过部分截取筛选以及图像增强处理(左右翻转、区域截取、颜色变换、噪声扰动)后的子数据(即32*32*3的RGB图像),利用深度学习技术提取图像特征,实现炉温工况端到端的故障识别与诊断,可以提高工况识别的准确率,降低人工劳动强度,提高电熔镁砂产品质量。

本文使用了一种多尺度卷积神经网络,并用一种简单的卷积神经网络进行对比实验。与简单卷积神经网络相比,使用预训练的网络结构GoogLeNet[4], 是2014年Christian Szegedy提出的一种全新的深度学习结构,在这之前的AlexNet、VGG等结构都是通过增大网络的深度(层数)来获得更好的训练效果,但层数的增加会带来很多负作用,比如overfit、梯度消失、梯度爆炸等。inception的提出则从另一种角度来提升训练结果:能更高效的利用计算资源,在相同的计算量下能提取到更多的特征,从而提升训练结果,提高卷积神经网络在数据集上的特征提取和泛化性能。

 

2.     技术路线

     本文主要使用MATLAB完成数据集处理和MSCNN的搭建和训练,与在python下主流的深度学习工作流类似,只不过在python下数据的运算是以特殊的数据类型Tensor(张量)进行运算,在网络训练以及GPU硬件加速方面比较友好;MATLAB作为成熟的商业软件,已经进行深度封装,同样支持GPU硬件加速。针对电熔镁炉的欠烧工况识别,可以借助于深度学习或者迁移学习快速构建和训练网络。与传统的机器学习相比,深度学习卷积神经网络具有良好的特征提取能力,不需要相关领域的先验知识。MATLAB下进行深度学习的图像识别的工作流一般包括数据集的导入、模型的搭建和训练、验证并测试。

    为了方便训练,首先要准备数据集,这里需要将train*.mat文件依次导入,并将相应的数据和标签合并成训练数据集。同样可以将train_*label.mat导入并制作验证数据集。在MATLAB中,标签label必须为categorical数据类型。选取其中的部分工况图片,如图2.1所示:

图2.1  电熔镁炉工况图例

为了提高网络的提取能力,使用了GoogLeNet的Inception[4]模块构建MSCNN进行迁移学习,Inception中将多个尺寸的卷积核组装成一个网络模块,设计神经网络时以模块为单位去组装整个神经网络。

图2.2 Inception模块

在MATLAB中使用layerGraph函数构建复杂网络。layerGraph可以指定深度学习网络的架构,具有更复杂的图形结构,其中层可以具有来自多个层的输入,并且输出到多个图层。具有这种结构的网络称为有向无环图(DAG)网络。创建layerGraph对象后,可以使用对象功能是绘制图形并通过添加、删除、连接和断开层的连接。这里定义的网络结构是基于GoogLeNet的结构进行迁移学习,将最后的全连接层修改为输出为2,应为整个数据集的类别为2分类(0或1)并将输入层进行修改(32*32*3)。整个网络的模型结构如图2.3。   

图2.3 MSCNN网络结构图

这里为了做对比实验,使用了一种简单的卷积神经网络,它的网络结构如图2.4所示。


图2.4 Simple CNN网络结构

3.     实验结果

3.1.  实验步骤

首先准备数据集,包括测试集和验证集,如图3.1所示。

图3.1 准备数据集

然后使用MATLAB的Deep Learning Toolbox中的layerGraph搭建MSCNN网络结构,参见图2.4和文献[4]。搭建完成后,可以使用plot(layerGraph)查看,如图3.2所示。

  图3.2 MSCNN网络

进行网络训练,选择相应的模型优化器、损失函数,设置学习率等超参数。

这里MSCNN:SGDM优化器,学习率0.001,采用交叉熵损失函数,batch_size=128,epoch=20;

简单二维卷积神经网络:SGDM优化器,学习率0.001,采用交叉熵损失函数,batch_size=128,epoch=20;

进行网络训练并保存结果。

3.2.  实验环境

本次实验的硬件环境是win10 台式机,使用的显卡(GPU)是NVIDIA GeForce RTX 3060 ,显存大小为12 GB,显卡可以用来实现深度卷积网络训练加速。实验软件环境为MATLAB R2022b,其中包含搭建和训练神经网络必须的工具箱Deep Learning Toolbox。Deep Learning Toolbox™ 包含一系列算法、预训练模型和应用程序,为设计和实现深度神经网络提供框架。它支持与常用的深度学习框架Pytorch、Tensorflow 2、ONNX(开放式神经网络交换)模型进行交互;同时,它支持在单GPU或多GPU工作站进行模型训练[5]。

3.3.  实验结果及对比

MSCNN的训练过程如图3.3所示。简单卷积神经网络训练过程如图3.4所示。

图3.3 MSCNN训练过程
图3.4  简单二维卷积神经网络训练过程

对比图3.3、图3.4可知,简单二维卷积神经网络由于模型结构简单(层数较少),参数量少,所以训练时间较短,在训练集上收敛较快,但后期波动较大,而MSCNN由于网络深、参数量大,训练时间较长,在训练集上收敛较慢,但训练过程相对稳定,在验证集的准确率为82.21%,高于简单卷积神经网络的74.87%。MSCNN在验证集上的混淆矩阵如图3.5所示,简单二维卷积神经网络在验证集的混淆矩阵如图3.6所示。

图3.5 MSCNN的卷积神经网络的混淆矩阵
图3.6 简单二维卷积神经网络混淆矩阵

由图3.5和图3.6知,MSCNN在预测类为1(欠烧)的工况全部正确(即预测为1且真实类也为1),而简单卷积神经网络存在预测为1却实际为0(非欠烧),同时在预测类为0的类中,MSCNN的误识别率为27.8%,而简单卷积神经网络的误识别率为35.1%(这里误识别指预测为0而实际为1)。

4.     结论

本文针对电熔镁砂的熔炼欠烧工况过程提出了一种多尺度的卷积神经网络,使用已有的GoogLeNet网络结构进行迁移学习,并在SAPI-FMF数据集上进行验证,与简单卷积神经网络相比有更好的特征提取和泛化能力。深度学习的智能诊断方法处理图像数据准确性高,是研究和解决工业故障诊断的重要手段。以上都是基于二维卷积神经网络的诊断方法,如果考虑实际工业生产过程,生产过程大部分时刻工作于正常状态,故障或异常工况只是突发情况,可以采用三维卷积神经网络将多帧图片滚动预测,考虑工况的时序信息,将会进一步提高识别正确率。

5.     参考文献

[1]卢绍文,王克栋,吴志伟等.基于深度卷积网络的电熔镁炉欠烧工况在线识别[J].控制与决策,2019,34(07):1537-1544.

[2]李军,宋伟.电熔镁产业发展研究[J].冶金能源,2010,29(04):8-10.

[3]吴高昌, 刘强, 柴天佑, . 基于时序图像深度学习的电熔镁炉异常工况诊断[J]. 自动化学报, 2019, 45(8): 1475-1485.

[4] Szegedy C, Liu W, Jia Y, et al. Going deeper with convolutions[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2015: 1-9.

[5] https://ww2.mathworks.cn/products/deep-learning.html,2023.03.01


基于深度学习的电熔镁炉工况智能诊断的评论 (共 条)

分享到微博请遵守国家法律