趋近智
协同过滤虽然功能强大,但完全依赖于用户互动的历史记录。当缺乏这些记录时,系统就无法生成有效的推荐。这种依赖性导致了构建推荐系统时最常遇到的挑战之一:冷启动问题。这个名称比喻了在寒冷天气下启动汽车引擎的情景:它需要先通过数据进行“预热”,然后才能顺畅运行。
这个问题主要有两种形式:新用户问题和新物品问题。
当用户第一次注册某项服务时,系统没有任何关于其偏好的记录。这就是用户冷启动问题。在用户-物品互动矩阵中,系统为该用户增加了一行,但这一行是完全空白的。
由于没有任何过往的评分、点击或购买记录,协同过滤模型无法:
想象一下一个新订阅视频流媒体平台的用户。该平台的基于用户的协同过滤通过寻找具有相似观看历史的老用户来提供建议。对于新订阅者,没有可供比较的历史记录。系统陷入了僵局。它充其量只能提供通用的推荐,例如平台上最热门的电影,这些内容并非个性化的,可能并不符合用户的实际兴趣。
同样地,当一个新物品加入目录时,还没有任何用户看过它或对其评分。这就是物品冷启动问题。在用户-物品互动矩阵中,系统为该物品增加了一列,这一列也是空的。
这个新物品处于推荐的盲区。因为没有用户与之互动,它不会出现在由标准协同过滤算法生成的任何推荐中。一本新出版的书或一部新加入流媒体库的独立电影,在有足够数量的用户自行发现并与之互动之前,将很难通过推荐系统被发掘。这可能会形成一个循环:不热门的物品因为推荐系统从不推广它们而一直保持不热门。
下面的图表在一个简化的用户-物品互动矩阵中展示了这两种情况。新用户和新物品处于孤立状态,缺乏协同过滤所需的互动数据。
新用户没有评分记录,新物品也没有收到过评分。两者都与协同过滤所依赖的现有互动网络断开了联系。
冷启动问题对不同类型的推荐算法影响不同。
处理冷启动问题是设计实用推荐系统的核心环节。虽然我们会在课程后期介绍混合系统等进阶方案,但一些常见的初步策略包括:
尽早理解这一挑战非常必要。它表明推荐系统不仅仅是一个单一的算法;它往往需要多种策略的组合,才能处理诸如新用户和新物品不断加入的情况。
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造