2023, 46(1):16-26.DOI: 10.11835/j.issn.1000-582X.2021.122
摘要:针对机床刀具磨损数据稀少与刀具磨损状态识别精度低的问题,提出了一种基于样本扩充与改进领域对抗网络(sample expansion and improved domain adversarial training of neural networks,SE-IDANN)的刀具状态识别方法。首先对机床刀具数据进行两次特征提取,并通过Smote算法进行样本扩充,解决机床刀具磨损数据量稀少的问题;其次在领域对抗网络(domain adversarial training of neural networks,DANN)模型特征提取器中加入残差块,进一步提取有效特征信息,解决刀具磨损特征微弱的难题;最后将Wasserstein距离作为目标域与源域的数据分布相似度标准引入DANN模型,实现对刀具磨损量的精确识别。通过对机床刀具数据的分析与仿真试验验证,证明该方法能够有效地识别刀具磨损量。
2023, 46(4):108-119.DOI: 10.11835/j.issn.1000-582X.2021.214
摘要:神经心理测试可以对各认知域受损严重程度做出客观评价,是检测疾病进展、评估药物疗效的有效手段。其中理解力测试部分通过判断受试者是否根据指令要求作出相应动作实现,是老年人认知功能障碍评估的重要部分,有利于痴呆的早预防早干预。文章提出了一套神经心理测试中理解力检测的人体姿态估计视频分析方法,基于Openpose深度卷积网络提取人体关键点坐标,随后基于图像形态学处理技术和Faster R-CNN等技术提出了纸张、牙刷等目标物体关键点二维坐标提取方法,并以量表中动作要求建立人体姿态估计数学模型。通过实验对神经心理测试的6个动作进行识别,结果表明,所提姿态估计数学模型和交互动作识别方法能够有效检测人体姿态动作指令及人与纸张的交互指令。
2023, 46(1):113-124.DOI: 10.11835/j.issn.1000-582X.2023.01.012
摘要:针对声纹识别领域中存在信道失配与对短语音或噪声条件下声纹特征获取不完全的问题,提出一种将传统方法与深度学习相结合,以I-Vector模型作为教师模型对学生模型ResNet进行知识蒸馏。构建基于度量学习的ResNet网络,引入注意力统计池化层,捕获并强调声纹特征的重要信息,提高声纹特征的可区分性。设计联合训练损失函数,将均方根误差(MSE,mean square error)与基于度量学习的损失相结合,降低计算复杂度,增强模型学习能力。最后,利用训练完成的模型进行声纹识别测试,并与多种深度学习方法下的声纹识别模型比较,等错误率(EER,equal error rate)至少降低了8%,等错误率达到了3.229%,表明该模型能够更有效地进行声纹识别。
2022, 45(1):59-67.DOI: 10.11835/j.issn.1000-582X.2020.306
摘要:针对因消弧线圈引起的故障电流信号微弱,造成谐振接地系统发生单相接地故障识别率进一步降低的情况,考虑故障线路与非故障线路间零序电流波形相似度低的特点,提出一种谐振接地系统的配电线路接地故障选线新方法。用HHT (Hilbert-Huang teansform)和时频谱带通滤波法处理零序电流波形,构建各线路零序电流波形的时频能量矩阵,结合图像识别中的相似度识别法与综合相似系数矩阵,实现线路接地故障选线。结果表明,该选线方法对噪声干扰、两点接地故障等情况均有效。
2022, 45(9):135-140.DOI: 10.11835/j.issn.1000-582X.2022.09.013
摘要:为了提高面部表情识别的精确度,提出了一种基于数据增强策略面部表情识别,区别于普通的在线随机数据增强,将实验用到的训练数据集采用附加不同的权重分配策略进行增强数据,并随机生成每次训练时的权重,保证其训练数据的多样性并通过比较实验结果得出哪种权重的分布策略适用于面部表情识别数据集的增强,同时解决了面部表情识别因数据集缺乏多样性识别精度不高等问题,提升了人脸表情识别的准确性和鲁棒性,此外还利用VGG19特征提取网络,通过从数据中学习鲁棒性和区分性特征,来实现高精度的面部表情识别。实验结果表明,使用该方式增强后的数据进行训练的模型在Fer2013和扩展Cohn-Kanade (CK+)数据库上对7种表情的识别率相比其原始数据集均有提升。
2021, 44(11):17-23.DOI: 10.11835/j.issn.1000-582X.2021.11.003
摘要:用传统的梅尔倒谱系数作为特征进行车辆识别时,识别效果易受噪声干扰。为增强特征鲁棒性,提出一种加权的基频自适应梅尔倒谱系数特征提取算法。首先用能熵比法对车辆声音信号进行端点检测;然后提取车辆信号的基频,自适应构建三角滤波器组,提高滤波器对基频的感知敏感度;最后对基频自适应梅尔倒谱系数进行F比加权。实验结果表明,与传统梅尔倒谱系数相比,在识别车辆时,加权的基频自适应梅尔倒谱系数识别准确率提高7.10%,虚警率降低3.93%,漏警率降低7.10%。
2021, 44(4):29-36.DOI: 10.11835/j.issn.1000-582X.2021.004
摘要:为解决当前智轨电车参数测量受限于车身过长、测量精度及效率等问题,通过一种基于四目视觉的立体视觉参数测量方法,研发了一套智轨电车参数测量方法与系统。基于空间向量定义车身平面、车轮转动角、铰接盘夹角及其零度,建立相关角度的视觉测量模型;研究合作标识识别及优化的高精度算法,实现角度精密测量;研发基于client-server(C/S)架构的智轨电车参数测量系统,实现角度快速测量。将参数测量系统应用于中车相应车辆标定中,结果表明该方法快速有效,车轮转向角测量精度优于±0.1°,铰接盘夹角测量精度优于±0.05°,为智轨电车参数的测量提供了一种大视野、高精度、高效率的检测方法。
2021, 44(6):43-48,83.DOI: 10.11835/j.issn.1000-582X.2020.011
摘要:针对现有车辆识别方法对于车型实时识别能力不足的问题,提出一种改进的深度可分离卷积的SSD(single shot multibox detector)算法用于车型识别研究。首先,利用深度可分离卷积网络进行特征提取,并引入反残差模块来解决因通道数少、特征压缩导致的准确率下降问题。其次,以车辆的刚体特性为依据,重新设计区域候选框,减少模型参数运算量。最后,在BIT-Vehicle数据集上进行消融实验来对比不同网络模型性能差异。结果表明:改进的深度可分离卷积的SSD车型识别方法有更好的车型识别效果,可以达到96.12%的识别精度,检测速度提高至0.078 s/帧。
2020, 43(11):21-28.DOI: 10.11835/j.issn.1000-582X.2020.11.003
摘要:基于稀疏表示分类(SRC,sparse representation for classification)是近年来模式识别领域中备受关注的一个研究热点。当每类训练样本较少时,SRC的识别效果往往不理想。为解决此问题,人们提出了拓展的稀疏表示分类算法。它引入了训练样本的类内变量矩阵,来补充每类训练样本信息。但是,该方法很难获取普遍存在于复杂数据如图像中的非线性信息。为此,提出了特征空间中的拓展稀疏人脸识别算法。该算法将样本集非线性映射到新的特征空间中,计算每个训练样本在表示测试样本时所做的贡献。根据贡献大小,给每个训练样本赋予一定的权重。同时,利用类内变量矩阵,共同表示测试样本。实验表明所提出的算法优于其它经典稀疏表示分类算法。
2019, 42(4):40-48.DOI: 10.11835/j.issn.1000-582X.2019.04.005
摘要:针对大尺寸结构振动和模态测量要求,提出一种基于字符编码标志的双目摄影目标追踪振动测量方法。设计了一种由字符和圆形组成的编码标志,采用自适应维纳滤波进行图像去噪,自适应局部阈值法提取字符特征,基于BP神经网络训练进行字符识别,实现目标的追踪匹配;进行标志区域灰度平滑,采用灰度质心法获取标志中心坐标;基于双目摄影振动测量方法计算测点的时域振动响应。以某3 kW风力机叶片为对象进行实验研究,结果与锤击法的前3阶频率相对误差均小于0.9%,表明该方法可靠可行。