趋近智
在上一章中,我们通过分析项目的固有属性生成了推荐。现在,我们将注意力从项目属性转向协同过滤中的用户行为。这项技术基于一个简单、直观的原理:过去意见一致的用户,在未来也可能达成一致。我们不再询问“这个项目是什么样的?”,而是询问“还有谁喜欢这个项目?”。
本章介绍基于邻域的方法,这是许多协同过滤系统的底层逻辑。我们将首先把数据整理成用户-项目交互矩阵,这是一个网格,其中每个单元格 代表用户 与项目 之间的交互。
由此,你将学会:
学习完本章后,你将构建一个实用的基于项目的协同过滤器,让你实际掌握如何纯粹根据用户交互模式来生成推荐。
3.1 协同过滤背后的逻辑
3.2 用户-物品交互矩阵
3.3 基于用户与基于物品的方法对比
3.4 使用 k-最近邻算法寻找相似用户和物品
3.5 计算相似度指标
3.6 使用加权平均值进行预测
3.7 解决交互矩阵中的稀疏性问题
3.8 动手实践:实现基于物品的过滤