融合矩阵分解和XGBoost的个性化推荐算法
DOI:
作者:
作者单位:

西南财经大学 统计学院

作者简介:

通讯作者:

中图分类号:

TP301.6

基金项目:

国家自然科学基金青年科学基金资助项目(11701466)


Personalized Recommendation System based on Matrix Factorization and XGBoost Algorithm
Author:
Affiliation:

School of Statistics,Southwestern University of Finance and Economics,Chengdu

Fund Project:

The National Natural Science Foundation of China for Young Scholars(11701466)

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对传统的协同过滤推荐算法中评分矩阵过于稀疏和算法准确度不高的问题,提出一种融合矩阵分解和XGBoost算法的推荐算法(MFXGB, Matrix Factorization XGBoost),其特点是利用SVD++算法(SVD, Singular Value Decomposition)对用户-项目评分矩阵进行填充,避免过多的缺失值对算法精确度的影响,再利用XGBoost (eXtreme Gradient Boosting)算法训练有监督的模型用于预测用户评分。为了克服计算成本过高的困难,提出利用K-均值聚类进行特征提取的方法用于训练XGBoost模型。将MFXGB算法MFXGB应用于MovieLens数据集进行实验分析,实验结果显示,MFXGB算法的推荐精确度比传统的三种方法分别提高了8.91%、10.18%和11.79%,效果明显优于传统的推荐算法。

    Abstract:

    In order to solve the data sparsity problem and enhance the recommendation accuracy, we proposed a new Matrix Factorization XGBoost (MFXGB) recommendation algorithm which combines the matrix factorization method and the XGBoost (eXtreme Gradient Boosting) algorithm. MFXGB algorithm uses the SVD++ algorithm (SVD, Singular Value Decomposition) to fill the user-item score matrix and then builds a supervised learning model to predict the user’s score. To reduce the computation time, we proposed to construct features based on the K-means clustering method. The results of the MovieLens dataset experiments show that the recommendation accuracy of the proposed MFXGB algorithm improves 8.91%, 10.18% and 11.79% respectively, compared with the three traditional algorithms.

    参考文献
    相似文献
    引证文献
引用本文
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2020-06-22
  • 最后修改日期:2020-09-10
  • 录用日期:2020-12-15
  • 在线发布日期:
  • 出版日期: