2. 重庆邮电大学自动化学院, 重庆 400065
2. College of Automation, Chongqing University of Posts and Telecommunic atlons, Chongqing 400065, P. R. China
近年来,城市汽车的保有量随着经济发展持续增加,汽车尾气已经成为人们日常生活中不能忽略的污染问题。汽车尾气中含有CO、THC、NOX、CO2等微粒物质在对自然环境造成污染的同时,也对人体健康造危害。为达到节能减排的要求,可采取提高燃油品质、优化发动机性能、增强三元催化器能效等手段,而相应的汽车尾气检测和评估方法是这些方法实现的基础,因而受到学术和工程界的广泛关注。文献[1]中给出一种基于单片机的汽车尾气检测系统,用于检测汽车尾气中氮氧化合物。在文献[2]中利用接触式IC卡完成对CO、NOX、烟度等汽车排放的尾气信息进行采集以及使用管理信息系统技术对排放尾气采集数据进行入库、写卡、读卡、查询、导入导出及权限、用户管理等功能。一种车辆电子鼻系统用来检测汽车尾气中的CO、HC等气体,然后利用MOS多传感器以及神经网络实现对气体的模式识别方法在文献[3]中得到应用。文献[4]利用FTIR、SMCA-REMPI以及SMPS等技术检测汽车尾气中NO、NO2、N2O、NH3等气体的定量排放特性。
事实上,发动机内的燃料发生极其复杂的物理化学反应,加之路况、驾驶方式的多样性,导致汽车尾气排放具有随机性,时变性和复杂的非线性[5]。通过传统的机理建模方法难以准确描述燃料的物化反应过程,影响汽车尾气排放水平的准确性的评估,寻求一种稳定性好、收敛速度快的汽车尾气评估模型显得尤为重要。从本质上来讲,对汽车尾气排放水平的评估属于模式问题,而模式识别领域更加侧重于在数据基础上建立问题的解决模型。因此,通过对排放数据进行分析,提取排放的特征,建立数据驱动模型对汽车尾气排放的建模是一条有效途径。近年来,频谱图被广泛地用于模式识别,在文献[6]中,提出一种频率与幅度随时间变化的复杂模式下对一个给定的字段进行频谱切割以及模板匹配的说话人识别方法;文献[7]中使用特定的图像处理技术对语谱图进行提取特征,然后通过变换提取特征里面的有效声学特性进行说话人识别。而神经网络由于它的自学习和自适应性、非线性性、鲁棒性与容错性、计算的并行性与存储的分布性、分布式存储等特点,经常被应用在模式识别中。径向基网络的不同层有着不同的功能,隐含层是非线性的,采用径向基函数作为基函数,从而将输入向量空间转换到隐含层空间,使原来线性不可分的问题变得线性可分,输出层则是线性的。而且径向基函数网络结构简单、收敛速度快、能够逼近任意非线性函数的网络,因此非常适合处理汽车尾气评估这类非线性建模问题[8]。
研究提出了利用汽车尾气的三维谱对汽车尾气进行评估的方法。该方法利用模式识别的原理,通过将气体信号转换到三维谱中,借助三维谱的特征,使用径向基神经网络进行分类评估。使用广义径向基网络减少了隐含层神经元,从而有效地减少了病态矩阵的出现。确定径向基神经网络参数对特征数据进行训练,然后进行测试,得到最终的识别结果。
1 汽车尾气评估方法汽车尾气评估方法如图 1所示。首先将输入气体转化为信号的形式,作为整个方法的输入,然后对输入信号xi进行预加重、加窗等预处理得到信号pi,对信号pi进行频谱分析得到三维谱,同时将三维谱作为特征,根据三维谱内含有的参数采用径向基神经网络进行分类识别,最后得到分类结果。
![]() |
图1 汽车尾气评估方法 Fig. 1 The assessment method of automobile exhaust |
三维谱是一种具有三维特征的频谱图像,3个坐标轴分别代表了时间、频率和气体的幅值信息,第三轴一般属于隐含信息,所以经常不在图像中直接显示出来。图像每个像素点反映了相应时刻和相应频率对应的振幅[9]。三维谱的基本数学公式为
x′(t)=∫nt=0x(t)ω(t−τ)e−jωtdt≡X(τ,ω), | (1) |
式中:x(t)代表要变换的信号;ω(t)代表了窗函数,一般选用汉明窗或者高斯窗,用x(t)ω(t-τ)表示信号在傅里叶变换时的相位与大小随时间和频率变化;X(m,ω)本质上是x(t)ω(t-τ)的傅里叶变换。为了抑制短时间傅里叶相位结果的跳跃不连续,沿着时间轴τ和频率轴ω进行相位解缠。时间指数τ通常被认为是“慢”的时间,一般不表达为高分辨率的时间t。在最典型的应用中,计算机通常使用离散的形式使用短时傅里叶变换,它的具体公式为
X(m,ω)=∞∑n=−∞x[n]ω[n−m]e−jωt, | (2) |
其中,信号x[n]的窗函数表示为ω[n]。变量m和ω是离散的。
1.2 径向基神经网络径向基神经网络结构如图 2所示,网络是由3层构成的前向网络:输入层,节点个数等于输入的维数;隐含层,节点数根据问题而定;输出层,节点数等于输出的维数。
![]() |
图2 径向基神经网络 Fig. 2 The radial basis function neural network |
径向基神经网络的计算公式为
yi=fi(x)N∑k=1ωikφk(x,ck)=N∑k=1ωikφk(‖x−ck‖2), | (3) |
其中:输入向量x∈Rn×1,函数φk(·)从R+(设为正实数)到R,‖·‖2表示欧几里得范数,ωik表示输出层的权值;N是隐层神经元的个数以及ck∈Rn×1表示RBF神经网络输出向量空间的中心。
隐藏层神经元的数量确定步骤为:1)先将径向基神经网络的隐层神经元数量设为1个;2)每次增加一个隐层神经元直到总的平方误差小于目标的误差或者达到设定的最大隐层神经元数量为止[10]。对于每个隐层神经元来说,与它相连的中心以及网络的输入距离是经过计算的。隐层神经元的输出距离是一个非线性函数。所以,网络最终的输出计算可以看成隐层输出总和的加权。
径向基神经网络有2个可调参数:权值ωij和中心Ch。径向基神经网络的学习主要分2个步骤:第一步调整中心,根据给定的样本决定隐层各节点高斯函数的中心Ch;第二步为网络权值调整,在确定隐层参数后,根据给定的训练样本,利用求伪逆的算法,得到输出层的网络连接权值ωij[11]。
1.2.1 中心调整算法——K-均值聚类算法K-均值聚类算法结构简单,且效率较高,能很好地得出网络中心[12],所以这里使用K-均值聚类算法,它将数据点划分为几大类,同一类型内部有相似的特点和性质,从而使得选取的中心点更有代表性。
假设有I个聚类中心,第n次迭代的第i个聚类中心为xi(n),i=1,2,...,I,这里I值需要根据经验确定[13]。执行步骤
1)初始化。从输入样本数据中随机选取I个不同的样本作为初始的聚类中心xi(0)。
2)输入样本。从训练数据中随机抽取训练样本Xk作为输入。
3)匹配。计算该输入样本距离哪一聚类中心最近,就把它归为该聚类中心的同一类,即计算
i(Xk)=argminXki−xi(n), | (4) |
找到相应的i值,将Xk归为第i类。
4)更新聚类中心。由于Xk的加入,第i类的聚类中心会因此发生改变。新的聚类中心为
xi(n+1)={xi(n)+η[Xk(n)−xi(n)],i=(Xk)ti(n),其他, | (5) |
其中,η为学习步长,0 <η <1。每次只会更新一个聚类中心,其他聚类中心不会被更新。
5)判断。判断算法是否收敛,当聚类中心不再变化时,算法就收敛了。实际中常常设定一个较小的阈值,如果聚类中心的变化小于此阈值,那么就没有必要再继续计算了。如果判断结果没有收敛,则转到第(2)步继续迭代。
1.2.2 网络权值调整算法权值调整的学习算法采用直接求伪逆的算法,即
ω=G+d,d=[d1,⋯dk,⋯dN]T, | (6) |
d为相应的期望,G+是矩阵G的伪逆。
伪逆的求法
G+=(GTG)−1GT, | (7) |
G={gki}, | (8) |
gki=exp(−12σ2i|Xk−ti|2),k=1,2,⋯N;i=1,2,⋯,I, | (9) |
其中:σi为扩展常数;Xk表示从训练数据中随机抽取的训练样本;G为非线性映射矩阵。
2 数值实验为了验证提出的方法的效果,选取2辆轻型车在同样环境下尾气排放测试的数据展开实验。利用结构简单、收敛速度快、能够逼近任意非线性函数的径向基函数网络来对气体的三维谱特征进行分类,得出最终的评估结果。
2.1 数据介绍数值来源于2辆轻型车在国标GB 18352.3下进行测试的数据。根据该标准,A、B两辆相同的轻型车在给定大气环境中和路况环境相似的市内指定路段以指定的速度进行测试,批次采集排放的数据进行数值实验。本实验中采集的数据主要有汽车运行时COH(g/100 km)、THC(g/100 km)、COL(g/100 km)、NOX(g/100 km)、HC(g/100 km)和CO2(g/100 km)气体的浓度。2辆轻型车测出含有上述6种气体浓度的各4组数据,每组数据的采样频率为1 Hz,每组数据采集780个样本。图 3为汽车车数据采集过程。
![]() |
图3 车数据采集过程 Fig. 3 The collection process of vehicle data |
需要指出的是,由于城区的空气污染较为严重,所以选择的路段都集中在城区,舍弃了郊区的路线,而通过改变采集过程中改变汽车的速度(速度最大值为120 km/h)可以研究速度对汽车尾气排放的影响。
2.2 实验过程通过采集数据得到了8组数据,每组6种气体,如图 4所示为原始数据图,图 5所示为气体的三维谱图,其中(a)为COH、(b)为THC、(c)为COL、(d)为NOX、(e)为HC和(f)为CO2的三维谱图,横轴代表时间,纵轴代表频率,隐含了第三轴幅值的信息通过图像5,可以直观的反应出各种气体具有明显的差异性,其中的条纹以及黑色部分可以用来确定具体气体时频图像的一般规律。通过时频分析得到所有6种气体的8组数据的图像,每类气体的图像归为一类,使用RBF神经网络进行分类。本实验中RBF神经网络的输入神经元m=6和输出神经元j=6,确定最佳的隐层神经元数量为5;训练次数,学习率以及误差分别设置为1 000,0.1,0.005;训练样本随机选取总样本的70%进行训练。可以用3个混淆矩阵描述识别的过程,混淆矩阵中的对角线数据即为正确识别的次数,而不在对角线中的数据即为识别错误的数据,加在一起则代表了总的识别次数,最终识别正确率则为混淆矩阵右下角给出的识别率。使用RBF神经网络训练如图 6所示,仅仅出现一次错误,将第三种气体归为了第五类气体,导致第五种气体的识别率变为6/(6+1)=85.7,但是其他几种气体的识别过程未出现错误,最终识别率为97.1%,因此训练过程是成功的。训练完了之后,选取剩下30%样本的一半用来测试,另外一半用来矫正,图 7所示的混淆矩阵为RBF神经网络测试的结果。第4种气体NOx错误的识别为了第一类气体COH,导致第一类气体的识别准确率变成1/(1+2)=66.7%,其他的识别准确率为100%,进一步的验证了实验的可行性。
![]() |
图4 汽车尾气排放数据 Fig. 4 The automobile exhaust data |
![]() |
图5 汽车尾气的三维谱特征 Fig. 5 The three-dimensiond spectral characteristics of automobile exhaust |
![]() |
图6 RBF神经网络训练结果的混淆矩阵 Fig. 6 The training results of RBF neural network |
![]() |
图7 RBF神经网络测试结果的混淆矩阵 Fig. 7 The testing results of RBF neural network |
实际上,仅仅使用训练混淆矩阵和测试混淆矩阵并不能充分说明实验方法的可行性,所以在最后结合了训练混淆矩阵、测试混淆矩阵以及矫正混淆矩阵给出了如图 7的全部样本的最终混淆矩阵。
如图 8中所示,第三类气体错误识别成第五类气体1次,第四类气体错误识别成第一类气体1次,第五类气体错误识别成第六类气体1次,一共只出现3次识别错误,最终的识别率为识别正确的次数与总识别次数的比值,即45/48=93.8%,达到了一个非常高的识别率。
![]() |
图8 最终识别结果的混淆矩阵 Fig. 8 The final recognition result of confusion matrix |
笔者提出了一种基于径向基神经网络的尾气排放评估,系统的论述了整个实验过程。主要贡献是将气体的不直观性转换到直观的层面来研究,在实验中利用径向基神经网络,对转换为图像的气体进行了有效的识别。通过时频分析,将时域的采样样本转换到时域得到一种类似于语谱图的图像,利用图像的特征进行分类实验。最终得到的实验结果,93.8%的正确识别率对研究方法做了进一步的论证。
[1] | Elman J L. Finding structure in time[J]. Cognitive Science, 1990, 14(2): 179-211.(![]() |
[2] | 郝文良,王程,田丽伟,等.基于单片机的汽车尾气检测系统[J]. 微型机与应用,2014,33(17):98-102. HAO Wenliang, WANG Cheng, TIAN Liwei, et al. Automobile exhaust remote testing system based on MSP430 single chip microcomputer[J]. Microcomputer & its Applications, 2014, 33(17): 98-102. (in Chinese)(![]() |
[3] | 李海涛,史爱松. 基于IC卡的汽车尾气排放检测数据管理信息系统的设计与实现[J]. 计算机工程与科学,2010,31(1):156-158. LI Haitao, SHI Aisong. Design and implementation of an automobile exhaust emission inspecting data management information system based on IC cards[J]. Computer Engineering and Science, 2010, 31(1): 156-158. (in Chinese)(![]() |
[4] | Wang Q, Song K, Guo T. Portable vehicular electronic nose system for detection of automobile exhaust[C]//2010 IEEE Vehicle Power and Propulsion Conference. [S.L.]: IEEE, 2010: 1-5.(![]() |
[5] | Yamada H, Misawa K, Suzuki D, et al. Detailed analysis of diesel vehicle exhaust emissions: Nitrogen oxides, hydrocarbons and particulate size distributions[J]. Proceedings of the Combustion Institute, 2011, 33(2): 2895-2902.(![]() |
[6] | Park J, Sandberg I W. Universal approximation using radial-basis-function networks[J]. Neural Computation, 1991, 3(2): 246-257.(![]() |
[7] | Dutta T. Dynamic time warping based approach to text-dependent speaker identification using spectrograms[C]//2008 Congress on Image and Signal Processing. May 27-30, 2008, Sanya, China. DC, USA: IEEE, 2008, 2 :354-360.(![]() |
[8] | Ajmera P K, Jadhav D V, Holambe R S. Text-independent speaker identification using Radon and discrete cosine transforms based features from speech spectrogram[J]. Pattern Recognition, 2011, 44(10/11): 2749-2759.(![]() |
[9] | 师彪,李郁侠,于新花,等. 基于改进粒子群-径向基神经网络模型的短期电力负荷预测[J]. 电网技术,2009,33(17):180-184. SHI Biao, LI Yuxia, YU Xinhua, et al. Short-term load forecasting based on modified particle swarm optimization and radial basis function neural network model[J]. Power System Technology, 2009, 33(17): 180-184. (in Chinese)(![]() |
[10] | Chi T, Shamma S A. Spectrum restoration from multiscale auditory phase singularities by generalized projections[J]. IEEE Transactions on Audio, Speech and Language Processing, 2006, 14(4): 1179-1192.(![]() |
[11] | 王孔森, 盛戈皞, 孙旭日, 等. 基于径向 基神经网络的输电线路动态容量在线预测[J]. 电网技术,2013,37(6):1719-1725. WANG Kongsen, SHENG Gehao, SUN Xuri, et al. Online prediction of transmission dynamic line rating based on radial basis function neural network[J]. Power System Technology, 2013, 37(6): 1719-1725. (in Chinese)(![]() |
[12] | 谭琨,杜培军. 基于径向基函数神经网络的高光谱遥感图像分类[J]. 光谱学与光谱分析,2008,28(9):2009-2013. TAN Kun, DU Peijun. Hyperspectral remote sensing image classification based on radical basis function neural network[J]. Spectroscopy and Spectral Analysis, 2008, 28(9): 2009-2013. (in Chinese)(![]() |
[13] | 赵磊, 贾振红, 覃锡忠, 等. 基于k均值和量子遗传算法的RBF网络优化[J]. 计算机工程,2011,37(10):152-153. ZHAO Lei, JIA Zhenhong, QIN Xizhong, et al. RBF network optimization based on k-means and quantum genetic algorithm[J]. Computer Engineering, 2011, 37(10): 152-153. (in Chinese)(![]() |
[14] | 谢娟英,蒋帅,王春霞,等. 一种改进的全局K-均值聚类算法[J]. 陕西师范大学学报(自然科学版),2010,38(2):18-22. XIE Juanying, JIANG Shuai, WANG Chunxia, et al. An improved global K-means clustering algorithm[J]. Journal of shanxi normal university: natural science edition, 2010, 38(2): 18-22. (in Chinese) |