[笔记]推荐系统实战第一课


第一课主要是概括性的描述了推荐系统的应用场景和评价指标,以及工业界和学术界对于该问题的一般性方案。

1.为什么会出现推荐系统

这个问题主要是由于信息过载与用户需求不明确两点共同导致,需要一个能够高效连接用户和物品,具有对长尾分布商品具有发现能力的方案。从商业角度的理解,便是可以对用户和内容生产者之间维护一种内在关联,从而通过商业方案实现商业目标。(对于商业角度的理解,个人认为需要依托于行业背景,才能够深入理解其中的内涵,对于课程而言,关注于第一点描述,也就是连接用户和商品,发现长尾商品)。

2.如何评价推荐系统

既然了解到推荐系统的出现背景和目标,之后就需要以一种量化方式对于设计出来的方案可以以有效的评价。

推荐系统的评估围绕三个核心实体之间的关系,三个核心实体:用户,网站,内容提供方。

请输入图片名称

这个地方,针对于工业时间和学术探讨,就会出现一些侧重点的不同。工业界具有更加丰富和多样的场景,需要多个指标共同描述当前推荐系统设计的程度;对于学术界本身使用的数据是固定且单一,往往都是对某几个指标优化以验证设计模型的优略达到论文发表的目的。

纵观不同评价指标,无论是学术界还是工业界,对于研究人员对于用户的反馈行为可以分为两个方面:显示反馈和隐式反馈。

显示反馈:不难理解,就是用户通过对商品或者其他实体直接标注评分等。

隐式反馈:通过用户对于商品或实体的点击频次,购买频次等反应用户对该实体的偏好程度。

这些都可以通过用户行为日志获取并量化。

3.当前推荐系统的整体架构

推荐系统发展已经有很多年,总结这些年的架构,可以概括为如下图描述

请输入图片名称

不同的模型,前提都是对于千万级别商品或其他实体的召回,通过设计不同的模型引入不同的特质对召回商品或其他实体集合进一步细化,最终通过排序反馈给用户。用户通过对推荐结果的反馈进一步对模型产生影响。从而实现推荐系统的宏观架构模式。

对比工业界和学术界,学术界往往专注于算法的研究,而工业界更关注于整体架构下的性能和评价。

请输入图片名称

以上是对于推荐系统的历程以及学术界和工业界区别的概述,下一节,主要从召回介绍

1.协同过滤

2.隐语义模型。
已邀请:

要回复问题请先登录注册

返回顶部