当前位置: 首页 > 大学题库 > 大数据技术

问题:

[问答题] CF(协同过滤)的原理?

参考答案:

协同过滤的主要目标:由于网络信息量的增多,用户往往被淹没在信息的海洋里,很难

很轻易的找到自己感兴趣的topic。协同过滤就是为了把用户最可能感兴趣的信息推送给用户。

协同过滤的方法: model-base,user-base,item-base,content-base。

1.user-based:搜集用户profile。对于一个active user,找到与其比较接近(或者相似)的几个neighbour。使用这些neibour 对active user 的interest 进行预测,把那些潜在的interest推荐给active user。

3.item-base:与user-based 相对应。协同过滤推荐根据用户对相似项的评分预测该用户对目标项的评分,它基于这样一个假设:如果大部分用户对一些项的评分比较相似,则当前用户对这些项的评分也比较相似。对每个item 寻找几个neighbour。例如如果item A 与item B是一个neighbour pair,对于一个active user,如果其对A 评价很高,或者有很高的兴趣,那么它极可能对B 感兴趣,这样B 就是一个潜在的interest.

4.content-based:根据item 的内容与用户历史兴趣度进行分析关联,它的一个前提假设就是如果一个用户在过去一段时间对某item 有较高的评价,那么在未来也会保持这种interest。

这样就可以根据item 之间的内容接近程度进行推荐。它有很大的缺陷,首先没有结合用户反馈,虽然一个item 具有很高的可推荐性,但是如果大家都对其评价较差,那么这也许是一个不好的推荐item;其次就是其对item 内容进行分析也只能是一个方面,不能全面深刻的描述一个item;再一个就是推荐的内容有限;当系统仅仅根据用户资料或项目描述来进行推荐的时候,用户被限制在只能得到与以往熟悉的内容相类似的项目。这样不利于挖掘用户潜在的兴趣。

  参考解析

暂无解析

试题来源参考:

公众号搜题更便捷

    扫码关注题大师公众号

    文字、语音、截图都可搜题

    亿级题库 秒出结果

相关题库

●    古埃及文明 ●    恋爱心理学 ●    劳动通论 ●    病理生理学 ●    大数据技术 ●    生理学 ●    语言学概论题库 ●    历史学 ●    未分类