购物网站的商品推荐算法有哪些？

2019年4月24日 181次阅读来源: a-du

作者：Razzit

链接：https://www.zhihu.com/question/19967564/answer/25015492

来源：知乎

著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

历史上，关联规则是最先被想到的推荐方法，啤酒和尿布的例子大家应该耳熟，不过某次去中科大参加龙星课程，据老师讲，当时IBM那帮人做关联规则苦于没有数据集，于是杜撰了一个数据集，结果跑出了啤酒和尿布这一奇葩，最后竟然大家都相信了。

关联规则最重要的就是发现共现关系（挖掘频繁项目集），经典算法有Apriori算法、FP-GROWTH算法。关联规则的应用场景是大量的用户购买了A之后还会接着购买了B和C，于是一旦发现用户购买了A，系统就会给用户推荐B和C。这个应用场景放在购物上是非常合适的，因为我们购物往往是根据当前的需求，也就是说用户购物的兴趣点是随着时间在变化的。关联规则可以给用户推荐完全不相似的物品，比如购买了数码相机，系统会推荐SD卡、数码相机电池等，在推荐系统领域专业的术语叫做推荐结果的多样性。

计算复杂度是关联规则挖掘最严重的缺点，随着频繁项目集大小的增加，挖掘的代价越来越高，尤其在数据集比较大的情况下，这就促使人们去寻找更加高效的方法。

协同过滤方法是一大类方法的统称，包括近邻方法，降维方法等等，所谓协同过滤简单来讲就是要给用户推荐和其相似的用户购买过的物品。

大家很熟悉的基于物品的相同过滤方法就属于近邻方法，基于物品的相同过滤首先由Amazon(电子商务领域运用推荐系统的代表，据其某位前科学家在博客中披露，2006年，推荐系统对Amazon营业额的贡献在35%左右)提出来，其基本思想是预先根据所有用户的历史偏好数据计算物品之间的相似性，然后把与用户喜欢的物品相类似的物品推荐给用户，举个例子，物品a和c非常相似，因为喜欢a的用户同时也喜欢c，而用户A喜欢a，所以把c推荐给用户A。和基于物品的协同过滤方法相对应的是基于用户的协同过滤方法，其基本思想是如果用户A喜欢物品a，用户B喜欢物品a、b、c，用户C喜欢a和c，那么认为用户A与用户B和C相似，因为他们都喜欢a，而喜欢a的用户同时也喜欢c，所以把c推荐给用户A。该算法用最近邻居（nearest-neighbor）算法找出一个用户的邻居集合，该集合的用户和该用户有相似的喜好，算法根据邻居的偏好对该用户进行预测。

除了近邻模型，降维模型也应用的非常普遍，具体的模型如Netflix比赛中Simon使用的由矩阵奇异值分解改造而来的隐因子模型(
Netflix Update: Try This at Home)，受限玻尔兹曼机模型等等，降维模型的共同特点就是要将数据使用更加抽象的低维特征表示，从而能够避免原始数据大量的干扰信息。

谈到降维模型，不得不说最近很火的深度学习，深度学习可以自动学习数据的抽象特征，本人的硕士论文题目就是基于深度学习的个性化推荐系统，这里就不多少说了。

暂时就写这么多了，有时间补充上基于内容推荐、混合推荐、基于上下文推荐等。作者：曾庆英

链接：https://www.zhihu.com/question/19967564/answer/33534574

来源：知乎

著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

注：以下内容非原创，为本人2年前整理自网上多种来源，但来源当时未标记，

时过境迁，也许推荐引擎不再是当初的模样。

——————我-是-分-隔-线，我是辛勤的搬运工，我是变态的整理侠——————————

与购物网站内部的搜索对应，购物网站一般还会有推荐引擎。因为在很多情况下，用户其实并不明确自己的需要，或者他们的需求很难用简单的关键字来表述。又或者他们需要更加符合他们个人口味和喜好的结果。最早将推荐引擎投入大规模使用的是亚马逊，它采用了一种关联推荐机制：当用户购买了一本书之后，页面上会出现这样一个框：你可能对这几本书也有兴趣。

根据推荐引擎是否为不同的用户推荐不同的数据可分为基于大众行为的推荐引擎（千人一面）和个性化推荐引擎（类似千人千面），题主说的应该主要是个性化的推荐引擎。

a1. 根据大众行为的推荐引擎，对每个用户都给出同样的推荐，这些推荐可以是静态的由系统管理员人工设定的，或者基于系统所有用户的反馈统计计算出的当下比较流行的物品。

a2.个性化推荐引擎，对不同的用户，根据他们的口味和喜好给出更加精确的推荐，这时，系统需要了解需推荐内容和用户的特质，或者基于社会化网络，通过找到与当前用户相同喜好的用户，实现推荐。