推荐系统分类

基于内容推荐
根据用户和项目的固有属性分别构建特征。然后计算用户和项目的距离
协同过滤的推荐 (CF)
协同过滤方法主要是计算用户间的相似性,然后把相似用户的喜好推送给目标用户。
基于内存的系统过滤 (Memory-based CF)
该方法大致分为两步:计算相似度;推荐把相似但未发生的项目。根据用户维度和项目维度可分为Item-based CF和User-based CF
Item-based CF
- 构建UI矩阵
- 计算item维度的相似度
- 计算选定item最相似的K个项目,得到推荐列表
- 构建用户还没发生行为的item
User-based CF
- 构建UI矩阵
- 计算user维度的相似度
- 选定最相似的K个用户
- 推荐与用户未发生过行为且在相似用户中发生的高频item
基于模型的协同过滤 (Model-based CF)
利用分类算法,回归算法、聚类算法、矩阵分解算法、神经网络算法、图模型算法以及隐语义模型等机器学习方法计算
FunkSVD, MF
把评分矩阵
分解为用户和项目两部分,目标为 为防止过拟合,funcSVD加入了L2的正则项
BiasSVD
在FuncSVD的基础上,加入了bias
SVD++
又在BiasSVD的基础上考虑了用户的隐式反馈
其中 是用户 产生行为的集合, 是项目 的个人喜好偏置; 是一个经验公式。 factorization machines (FM)
针对输出数据特别稀疏的问题,考虑特征与特征之间的关系
其中 是两个 维度维向量的内积: Bayesian Personalized Ranking (BPR)
利用已有的用户偏好信息,构建偏序关系。在这些偏序关系上利用贝叶斯公式计算偏序的概率。
Collaborative Metric Learning (CML)
距离学习,最小化相似user-item的距离,最大化不相似user-item的距离。
混合的推荐
多种方法的混合
评测指标
评分预测
对user-item对的得分进行预测,这是一个回归问题。一般用RMSE,
MAE等进行评价 - RMSE
- MAE
### TOP-K 列表推荐
此时,真实列表与推荐列表的。用