1、什么是推荐系统中的冷启动问题
推荐系统中的冷启动问题:在没有大量用户数据的情况下如何给用户进行个性化推荐,目的是优化点击率、转化率或用户体验。
冷启动问题:
- 用户冷启动
- 物品冷启动
- 系统冷启动
解决冷启动问题的方法一般是基于内容的推荐。
2、用户冷启动
对一个之前没有行为或行为极少的新用户进行推荐
- 根据用户的注册信息(年龄、性别、爱好等)、搜索关键词或者合法站外得到的其他信息(例如用户使用Facebook 账号登录,并得到授权,可以得到 Facebook 中的朋友关系和评论内容)来推测用户的兴趣主题。
- 得到用户的兴趣主题之后,可以找到与该用户兴趣主题相同的其他用户,通过他们的历史行为来预测用户感兴趣的电影是什么。
3、物品冷启动
为一个新上市的商品或电影寻找到具有潜在兴趣的用户
根据电影的导演、演员、类别、关键词等信息推测该电影属于的主题,然后基于主题向量找到相似的电影,并将新电影推荐给以往喜欢看这些相似电影的用户。可以使用主题模型(LSA、LDA 等)得到用户和电影的主题。
用户——主题
- 将每个用户看做主题模型中的一篇文档,用户对应的特征作为文档中的单词,这样每个用户可以表示成一袋子特征的形式。
- 通过主题模型学习之后,经常共同出现的特征将会对应同一个主题,同时每个用户也会相应地得到一个主题分布。
每个电影的主题分布也可以用类似的方法得到。
4、系统冷启动
如何为一个新开发的网站设计个性化推荐系统
首先可以得到每个用户和电影对应的主题向量, 除此之外, 还需要知道用户主题和电影主题之间的偏好程度, 也就是哪些主题的用户可能喜欢哪些主题的电影。 当系统中没有任何数据时, 我们需要一些先验知识来指定, 并且由于主题的数目通常比较小, 随着系统的上线, 收集到少量的数据之后我们就可以对主题之间的偏好程度得到一个比较准确的估计。