关于加权因子论文范文资料与一种基于加权因子的混合协同过滤算法有关论文参考文献-论文写作网

《一种基于加权因子的混合协同过滤算法》：此文是一篇加权因子论文范文,为你的毕业论文写作提供有价值的参考。

摘要：为改进传统协同过滤算法的准确率问题,该文提出一种基于加权因子的混合协同过滤算法.该算法核心是将传统的用户和物品协同过滤算法预测集合进行交集运算,并对其评分进行加权混合得到推荐结果.通过在MovieLens-100k数据集上与传统协同过滤算法进行比较,结果表明,该文的混合协同过滤算法在平均绝对误差和均方根误差两个评价指标上都优于传统协同过滤算法.

关键字：协同过滤；混合协同过滤；MovieLens-100k数据集

中图分类号：TP31 文献标识码：A 文章编号：1009-3044（2018）09-0014-03

Abstract： In order to improve the accuracy of traditional collaborative filtering algorithm, this paper proposes a hybrid collaborative filtering algorithm based on weighting factors. The core of this algorithm is to combine the traditional user and item collaborative filtering algorithm to get the recommended result. Compared with the traditional collaborative filtering algorithm on MovieLens-100k data set, the results show that the hybrid collaborative filtering algorithm is superior to the traditional collaborative filtering algorithm in both erage absolute error and root mean square error.

Key words： Collaborative filtering； Hybrid collaborative filtering； MovieLens-100k data set

协同过滤算法是通过用户和网页的互动过滤掉用户不喜欢的商品,从而对用户进行推荐.最早于1992年被应用于邮件过滤系统,之后又被GroupLens应用于新闻过滤系统,直至今日,仍被各大电商网站,如淘宝、京东所应用.然而经过大量学者研究发现,协同过滤算法存在几个不足之处：冷启动性,数据稀疏性,可扩展性和准确性问题.其中,端德坤和傅秀芬针对冷启动性问题进行了研究,通过引入用户信任机制和人口统计学信息对其进行改进,在一定程度上对冷启动性问题进行了缓解[1].何佳知是将基于内容和协同过滤算法相结合,并融入了k-means算法,有效地解决数据稀疏性这一问题[2].但准确率仍然是推荐算法最核心的问题.本文则针对准确性问题,提出了一种混合协同过滤算法,该算法通过加权因子将基于用户的和基于物品的协同过滤算法相结合.并在MovieLens-100k数据集上进行测试比较,结果表明本文的混合协同过滤算法在准确率方面有显著提高.

1传统的协同过滤算法概述

协同过滤算法被分为两大类：基于内存的协同过滤算法和基于模型的协同过滤算法.其中基于内存的协同过滤算法由分析目标的差异被分为：基于用户的协同过滤算法（UCF,user-based collaborative filtering）和基于物品的協同过滤算法（ICF,item-based collaborative filtering）.本文算法主要将基于内存下的两类算法进行混合,下面详细介绍基于用户和基于物品的协同过滤算法.

1.1 基于用户的协同过滤算法

基于用户的协同过滤算法核心思想是给用户推荐与其兴趣相似的用户所喜欢的物品,主要根据用户相似度和用户行为数据信息进行预测推荐.该算法实现需要两个步骤：

（1）找到和目标用户相似的用户群体.用户之间的相似度通常使用皮尔逊相关系数、余弦相似度或修正的余弦相似度公式来度量[3],公式定义分别如下所示：

其中,[Rui]和[Rvi]分别表示用户u和用户v对物品i的评分值,[Iuv]表示用户u和用户v有过评分物品集合的交集,[R_u]和[R_v]分别表示用户u和用户v有过物品评分的平均值.

（2）根据用户之间的相似度,通过公式（1.4）计算目标用户u对物品i的预测评分：

其中,[Rui]表示用户u对物品i的预测评分,[NUu]表示与用户u相似的用户集合.

1.2 基于物品的协同过滤算法

基于物品的协同过滤算法是根据物品相似度和用户的历史行为对用户进行推荐.算法的步骤包括两步：第一是计算物品之间的相似度.物品相似度同样可以用皮尔逊相关系数、余弦相似度或修正的余弦相似度公式来度量.

皮尔逊相关系数定义如下：

其中,[Rui]和[Ruj]分别表示用户u对物品i和物品j的评分值,[R_i]和[R_j]分别表示物品i和物品j的平均评分,U表示对物品i和物品j共同有过评分的用户集合.

第二是通过用户历史行为和物品相似度生成推荐列表.其中对物品进行预测评分公式定义如下：

其中,[Rui]表示用户u对物品i的预测评分值,[Nu]表示用户u评分的物品集合.

2本文算法

传统的基于用户的协同过滤算法是根据邻居用户的偏好来预测目标用户的喜好,对目标用户的物品喜好缺乏考虑.基于物品的协同过滤算法是根据目标用户的物品相似度来进行推荐,忽略了用户相似邻居的推荐.为了避免单一算法存在的不足,大部分情况下是将算法进行混合,从而做出更好的推荐.常见的混合方式包括：加权型混合、交换型混合、特征组合型混合、瀑布型混合等方式[4].本文算法通过加权将传统的基于用户和基于物品的协同过滤算法进行混合来提高推荐的准确率,综合两种算法的优势,在考虑用户邻居偏好的同时考虑了用户自身的物品喜好,产生了一种混合协同过滤算法.

加权因子论文参考资料：

结论：一种基于加权因子的混合协同过滤算法为关于加权因子方面的的相关大学硕士和相关本科毕业论文以及相关加权因子论文开题报告范文和职称论文写作参考文献资料下载。