您现在的位置是:首页 > 恋爱课程恋爱课程

隐性兴趣指标 基于综合兴趣度的协同过滤推荐算法

2021-06-04 22:00:56恋爱课程人已围观

简介隐性兴趣指标 基于综合兴趣度的协同过滤推荐算法种用户兴趣指标提出了综合兴趣度的概念,并将这种基于综合兴趣度的协同过滤方法应用于一种图书推荐系统中。基于综合兴趣度的协同过滤方法基于综合兴趣度的协同过滤方法包括以下步骤:值有了明显的降低,可见基于综合兴趣度的推荐方法能够有效地提高协同推荐系统的推荐质量。基于项目评分预测的协同过滤推荐算法[J].基于商品属性隐性评分的协同过滤算法研究[J].

泡学网

隐性兴趣指标 基于综合兴趣度的协同过滤推荐算法

1 概览

电子商务推荐系统最大的优势在于可以收集用户兴趣数据和个人信息,并根据用户兴趣偏好主动为用户进行个性化推荐。推荐技术是指如何找到用户感兴趣的产品并进行推荐。在用户信息获取差异不大的情况下,推荐技术成为决定推荐系统性能的关键,而推荐算法是推荐技术的核心[1]。

协同过滤技术是实际应用中应用最广泛的推荐技术。许多在线书店,包括,正在使用协同过滤技术。协同过滤是一种基于用户相关性的推荐算法。这种推荐方法将具有相同购买习惯或兴趣的用户归入同一组。同一组内的用户可以互相分享信息,互相推荐产品。众所周知的应用协同过滤技术的推荐系统有/[2]、/[3]、[4]等。协同过滤技术的缺点主要表现在最近邻的准确度上,即当客户有产品评分数据较少,仅利用客户的注册兴趣信息和评分数据难以准确确定最近邻,导致推荐质量下降这种问题是协同过滤技术本身无法克服的,需要有待改进。

针对协同过滤算法中的最近邻判断精度问题,本文综合了显性兴趣、隐性兴趣和预测兴趣三个用户兴趣指标,提出了综合兴趣的概念,并以此为基础基于度的协同过滤方法应用于图书推荐系统。实验结果表明,该方法提高了计算用户最近邻的准确率,对优化推荐系统的推荐质量起到了重要作用。

2 基于综合兴趣度的协同过滤方法

协同过滤方法的关键是确定用户的最近邻居。确定最近邻的基础是计算用户之间的相似度,兴趣度是计算用户相似度的重要指标。一般来说,用户相似度计算方法包括余弦相似度、修正余弦相似度、相关相似度等[5]。传统的兴趣度计算方法主要考虑用户提供的注册信息和显性产品评分,即显性兴趣度。由于显性兴趣不能完全反映用户的真实兴趣,以上三种方法纯粹是通过显性兴趣度来计算的。用户相似度存在一定缺陷[6]。使用余弦相似度度量时隐性兴趣指标,未评级产品的兴趣得分均设为0,即兴趣度相同,但实际上用户对未评级产品类别的兴趣不可能完全相同。修正余弦相似度采取了一种改进措施,为未评分项设置平均分值,但仍不能有效解决问题。

相关相似性度量仅度量具有分数的项目。当有更多共同评分的项目时,这会更准确。如果共同评分的项目较少,则偏差可能更大。

在心理学中,人们的兴趣包括主观表达、客观描述以及基于知识和经验的兴趣期望。具体在推荐系统中,兴趣的主观表达可以理解为用户在兴趣问卷中主动提供自己的兴趣。这个表达比较固定,属于显性兴趣。用户的浏览行为反映了用户的实际需求,浏览行为的不断变化往往预示着原有兴​​趣的调整。这是对用户兴趣的客观描述,属于隐性兴趣度。

在用户未评分的物品中,可以通过分析物品的特征和用户的兴趣规律来预测用户未来的评分。这是基于现有数据对用户兴趣的合理预期,属于预测的兴趣度。有学者在他们的研究中提到了利用用户浏览行为来计算用户的隐含兴趣度[7]或利用产品之间的相关信息来预测用户对某些产品的评分的想法[8],但这些方法只考虑用户兴趣。部分内容没有完全描述用户兴趣。

因此,本文提出了将显性兴趣度、隐性兴趣度(统称为现有兴趣度)和预测兴趣度相结合的综合兴趣度概念。综合兴趣度可以使用户之间的相似度度量更准确、更完整地反映用户的兴趣。基于综合兴趣度的协同过滤方法包括以下步骤:

获取用户对产品的兴趣评分,结合对用户浏览行为的分析,获取现有兴趣;

结合已有的兴趣度和预测的兴趣度,分析用户之间的兴趣相似度,选择一组与用户兴趣相似的最近邻;

从最近邻感兴趣的产品中,预测用户对某个产品的偏好,最终产生推荐结果。

2.1 收购现有权益

许多早期的协同过滤系统通常只使用明确的兴趣来生成推荐。显式分数信息一般较为准确,但由于用户一般在注册时填写的项目较少,因此用户常见的显式分数较多。少数情况下,如果单独比较用户相似度,误差比较大,所以需要综合隐蔽评分,提高判断用户间相似度的准确度。现有权益的获取包括显性权益获取和隐性权益获取两部分。

显性兴趣度来自用户的显性评分,需要用户有意识地表达对产品信息的认同程度。在一般的协同过滤推荐方法中,常使用整数值(如1-9级)来表示不同程度的喜欢。该算法用归一化为0~1的兴趣度来表示。设Re(i,j)为用户i对产品类别j的所有n个产品类别的显性兴趣,1代表所有显性兴趣,则:

隐含兴趣程度来自用户对产品的浏览行为信息。在用户-商品矩阵中,评分数据是用户查看产品的次数。 0 表示没有发生利息。数量越多,利息越高。获取隐藏兴趣的方法比较简单,可以从用户的浏览历史数据库中获取隐藏兴趣。某个产品类别的隐藏兴趣得分可以用用户浏览的产品类别在用户整个浏览历史中所占的百分比来表示。令 Ri(i,j) 表示用户 i 在所有 n 个产品类别中对类别 j 的隐性兴趣隐性兴趣指标,1 表示所有隐性兴趣,则:

通过上述方法得到显性兴趣度和隐性兴趣度后,将两者结合,形成用户现有的兴趣度。将这两个兴趣度以线性关系组合,得到用户i对产品类别j的兴趣已经感兴趣:

其中,α为显性兴趣度的权重参数。 α值越大,显性兴趣度越重要; m代表浏览历史数据库中用户浏览的产品总数。

2.2 综合权益的获得和最近邻的形成

在得到综合兴趣度之前,首先要得到预测的兴趣度。本文利用产品的属性分类关系和客户购物的相关性,建立产品的属性向量表达式和客户兴趣向量表达式来预测用户对未评级产品的兴趣程度。首先对所有商品进行分类,构建层次分类树。每个商品都属于分类树的最低类别之一。最底层的每个类别对应一个商品属性,然后所有的属性构成了每个商品的类别。属性向量。属性权重根据产品在分类树中的类别与其他类别之间的分类关系,以及类别之间的关联规则来设置。其中,关联规则是根据客户购买记录在各层级类别中的分布情况,挖掘各层级同一层级类别之间的关联规则。假设在所有n个产品类别中,每个产品类别都作为一个特征项,任何一个产品类别j都可以表示为一个n维特征向量:

其中,Ps,j为第s个特征项的权重,本系统规定Ps,j的值为

其中C(s)和C(j)分别代表商品类别s和j的父类别; s⇒j 表示 s 和 j 之间有很强的关系。得到每个类的特征向量后,就可以得到类之间的关联关系。通过这种关系,可以使用评级类别来预测未评级类别。假设用户i已评分的类集用Ai表示,k∈Ai,未评分产品类m∉Ai隐性兴趣指标,Ri,k代表用户i对评分类k的兴趣,则用户i对未评分类j的兴趣期望值 Pri,j 是

归一化过程使所有期望兴趣度为1,用户i对未评级类别j的期望兴趣度i、j Rp为

为了结合现有兴趣度和期望兴趣度,设置系数β(0≤β≤1),平衡现有兴趣度和期望兴趣度的比值,得到综合兴趣度:

判断两个用户是否是邻居,需要比较两个用户的兴趣相似度。常用的相似度度量方法包括余弦相似度、修正余弦相似度和相关相似度。

由于按照本文的方法可以得到比较完整的兴趣分数,所以本文采用余弦相似度作为度量方法。假设用户i和用户j对n维类的兴趣度分别表示为向量i和j,用户i和用户j的相似度sim(i,j)为

其中'Ri,d和'Rj,d分别代表用户i和用户j对d类的兴趣。

寻找最近邻的目标是为每个用户u在整个用户空间中找到用户集D=(d1,d2,...,dk),使得u∉D,以及d1和d之间的相似度u sim(u ,d1)最高,d2与u的相似度为sim(u,d2)次之,以此类推。

2.3 推荐结果的生成

通过上述相似度度量方法得到目标用户的最近邻后,需要利用最近邻的观点为目标用户生成相应的产品推荐。一种常用的预测目标用户未评分项目评分的方法是将最近邻未评分项目的评分积分作为目标用户对预测项目的评分。

本文使用最频繁的商品推荐为目标用户生成Top-N推荐:在浏览历史数据库中,扫描目标用户每个最近邻的浏览记录,统计他们浏览过的商品,并选择最频繁和目标用户 未被视为推荐内容的前 N ​​个产品。假设目标用户u浏览的产品集合为A,最近邻浏览的产品集合为D,候选推荐产品集合

C=D-A,候选产品b∈A,则候选产品b对用户u Recb,u的推荐度为

其中,d ,bd ∈ Σ 为查看过产品 b 的最近邻居数; Sumc 是最近邻居的总数。

3 实验与结果分析

为了验证本系统的推荐效果,在小范围内进行了实验,以平均绝对偏差作为衡量标准来衡量协同过滤推荐的实验结果,基于综合的方法通过比较分析验证了兴趣。有效性。

3.1 实验过程及评价标准

为了方便测试,实验前在系统中输入了约1000本电脑书籍,并邀请了某公司的82名员工参加了实验。实验周期为1个月。实验的前 20 天是用户的免费浏览时间。系统不会生成建议。实验用户需要注册并填写明确的分数。实验结束后,系统为注册用户生成推荐列表,并要求用户对每个推荐的书目都满意。程

学位反馈。

在评估协同过滤推荐的效果时,本文使用平均绝对偏差(Mean ,Mean,MAE)作为衡量推荐系统满意度的公式。 MAE用于衡量推荐值与实际评价值的偏差,可以直观地衡量推荐的质量。 , MAE 越小,推荐质量越高[9]。本次实验中用户u的平均绝对偏差为

其中,n为Top-N推荐总数; pu,i 是实际得分; qu,i 是对应的预测分数。

3.2 实验结果分析

系统得到实验数据后,在推荐的Top-10、Top-20、Top-30范围内,对比实验用户的推荐结果和反馈满意度,然后用平均绝对偏差公式进行比较。计算基于综合兴趣度的方法和基于显性兴趣度的传统方法。计算结果见表1,对比分析见图1。

从图1可以看出MAE值在0.12~0.17之间,说明系统可以达到较好的推荐效果。随着Top-N数量的增加,MAE值呈下降趋势,说明Top-N中N值较大时用户满意度较高。

传统的协同过滤方法仅使用显性兴趣作为用户相似度的计算指标,计算最近邻的准确率较低。从实验结果可以看出,其MAE值较高,推荐质量不高。

本文推荐方法采用综合兴趣度作为用户相似度的计算指标。实验表明,在相同条件下,MAE值已经明显降低。可见,基于综合兴趣度的推荐方法能够有效提高协同推荐系统的性能。推荐品质。

参考资料

[1] R. [J]。 ACM, 1997, 40(3): 56-58.

[2] P, N, M.: An Open of [C]//Proc.的工作。美国北卡罗来纳州希尔:[s. n.], 1994: 175-186.

[3] U, Maes P.:对于“Word of ”[C]//Proc. ACM CHI,美国:[s. n.], 1995.

[4] N D,Oki B M. 到 [J]。 ACM, 1992, 35(12): 61-70.

[5] BM、G、JA 等。 Item- [C]//Proc. 10th Wide Web Conf.. Hong Kong,: [sn], 2001: 285-295.

[6] 邓爱琳,朱扬勇,施伯乐。基于项目评分预测的协同过滤推荐算法[J].软件学报, 2003, 14(9): 1621-1628.

[7] 陈东林,聂规划。基于商品属性隐式评分的协同过滤算法研究[J].计算机应用学报, 2006, 26(4): 966-968.

[8] 白立军,刘俊强。一种求解协同过滤中矩阵稀疏问题的算法[J].信息学报, 2005, 24(2): 199-202.

[9] J S, C. of [C]//Proc.在,美国:[s。 n.], 1998.

Tags:隐性兴趣指标

站点信息

  • 文章统计12929篇文章
  • 浏览统计16816474次浏览
  • 微信:781775075