一种多分类的微博垃圾用户检测方法
CSTR:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

TP393

基金项目:

国家自然科学基金项目(61772099);中国博士后基金(2014M562282);重庆市博士后项目(XM2014039);重庆市人工智能技术创新重大主题专项(cstc2017rgzn-zdyf0140);重庆市高校优秀成果转化资助项目(KJZH17116)。


A multi-classification method for detecting microblog spam users
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对微博多类垃圾用户的检测问题,设计了一种基于模糊多类支持向量机的垃圾用户检测方法。首先,采用一对多SVM(support vector machines)的构造思想来构造多分类器,并针对每类用户的分类器重新选择训练集;然后,利用构造好的训练集来训练多分类器,经过反复调整参数,得到5个用户分类器;最后,针对多分类器的不可分样本,采用模糊聚类来进行模糊处理,即在垂直于SVM的最优分类面上定义一个改进的隶属度函数,选择最大隶属度对样本进行再分类。实验结果表明,该方法在保证垃圾用户检测效果的前提下,可以解决多分类中存在的混分和漏分问题。

    Abstract:

    Based on fuzzy multi-class support vector machine, a method for detecting microblog spammers is designed. Firstly, a multi-class SVM(support vector machines) is used to construct multi-classifiers, and a training set is re-selected for each type of user's classifier. Then, the constructed training set is used to train the multi-classifier, and five user classifiers are obtained after repeated remediation. Finally, for the non-separable samples of multiple classifiers, fuzzy clustering is used to perform the fuzzy processing. An improved membership function is defined on the optimal classification plane perpendicular to the SVM, and the maximum membership degree is used to reclassify the samples. Experimental results show that this method can solve the problems of mixing and missing points in multi-classification under the premise of ensuring the detection effect of spammers.

    参考文献
    相似文献
    引证文献
引用本文

杨云,徐光侠,雷娟.一种多分类的微博垃圾用户检测方法[J].重庆大学学报,2018,41(8):44-55.

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2018-04-02
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2018-08-01
  • 出版日期:
文章二维码