趋近智
推荐系统通常使用两种主要的推荐方式,每种方式都有其自身的优缺点。基于内容的过滤在处理丰富的物品元数据方面表现出色,但可能会产生过滤气泡。协同过滤可以发现新颖的物品,但在交互数据稀疏时表现不佳。实际生产中最有效的系统很少只选其一;相反,它们旨在将两者结合起来,形成一个更强大的单一系统。
本节概述了一个能够巧妙结合基于内容和协同过滤模型信号的系统架构。目标是创建一个更准确、能应对冷启动场景,并能提供多样化且相关建议的推荐器。
混合系统的核心是并行运行多个推荐算法,然后整合它们的输出。一个被称为“混合引擎”的中心组件负责这种综合处理。它接收来自每个底层模型的预测或排名列表,并应用特定的逻辑来生成最终向用户展示的推荐列表。
下图展示了此类系统中的数据和预测流向。
混合推荐系统的架构概览,展示了从数据源到最终整合推荐的流程。
让我们分析一下该系统的运作方式:
混合引擎最直接的方法是使用加权平均值。为了使其生效,两个模型必须为每个候选物品输出一个数值预测评分,且最好归一化到统一标准(例如 0 到 1)。然后,引擎使用线性组合计算最终的混合评分:
在此公式中, 是介于 0 和 1 之间的超参数,用于控制每个模型的影响力。
的最佳值通常通过测试不同的数值并测量其对 NDCG 或 Precision@k 等离线评估指标的影响,由实验来确定。
更先进的混合引擎可以使用切换策略。它不总是一味混合,而是应用规则来决定在特定情况下信任哪个模型的输出。这对于处理冷启动问题特别有效。
引擎内部的逻辑可能如下所示:
这种基于规则的方法使系统更具适应性。它会针对任何给定的用户-物品对,默认使用最适合当前数据量的模型。
通过设计一个结合这些信号的系统,我们可以创建一个整体性能优于各部分之和的推荐器。它可以通过协同过滤挖掘出新颖的物品,同时确保每个物品(无论新旧)都有机会通过其内容特征被推荐。结果是获得更全面且可靠的推荐体验。在下一节中,我们将实现一个加权混合系统,以观察这些原理的实际应用。
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造