基于自注意力机制和多特征提取的重复缺陷报告检测模型
投稿时间:2021-04-13  修订日期:2021-05-31
关键词:重复缺陷报告检测  长距离依赖  自注意力机制  语义分析  多特征提取
基金项目:国家自然科学基金资助项目(No.61502401, No.12050410248)、四川省科技计划项目(No.2021YFH0120)、西南民族大学中央高校基本科研业务费专项资金(No.2020YYXS59)。
作者单位邮编
周文杰 西南民族大学 计算机系统国家民委重点实验室 610041
谢 琪* 西南民族大学 计算机系统国家民委重点实验室 610041
崔梦天 西南民族大学 计算机系统国家民委重点实验室 
摘要点击次数: 789
全文下载次数: 0
摘要:
      针对重复缺陷报告检测研究中存在语义长距离依赖以及缺陷报告特征的单一性问题,提出一种基于自注意力机制和多特征提取的重复缺陷报告检测模型。引入自注意力机制捕获缺陷报告文本序列内部的语义关联性,从而动态计算上下文语义向量进行语义分析,解决长距离依赖问题;利用隐含狄利克雷分布算法捕获缺陷报告文本的主题特征,同时针对缺陷报告的类别信息,构建一种特征提取网络计算类别差异特征;最后基于三类特征向量进行综合检测。实验结果表明,该模型实现了更优的检测性能。
  查看/发表评论  下载PDF阅读器
Copyright@ 2008 All Rights Reserved.