大数据用户画像的推荐模式与优缺点

电子说

1.2w人已加入

描述

基于用户画像,根据每个用户使用路径与个人偏好推荐内容已经成为内容类产品常见的功能模式,也是提升活跃度与转化率最有效的方式之一。

在之前的课程中,我们介绍了用户画像的定义、标签体系与创建过程,本期课程则重点介绍几种不同的推荐模式与优缺点。

常见的推荐逻辑

根据用户信息进行推荐,用户进入产品后需要完善个人信息及选择兴趣标签,系统根据用户的个人信息(年龄、性别、地域)及所选兴趣标签与内容匹配,推荐内容标签匹配度高的内容。

这种推荐模式的优点在于技术门槛低,由产品经理自己设计一套推荐规则就可以实现。但缺点也很明显,一方面用户会不停收到相似的内容,很难拓展新的关注点,另一方面,内容生产商会根据推荐机制针对性设置内容的标签、关键字等信息,将低质量的内容推荐给用户,造成用户流失。

基于大数据的推荐模式

该模式的核心在于,通过建立较复杂用户画像模型,收集各种途径收集用户行为数据。根据用户业务数据生成用户画像,计算用户画像相似度,对用户画像进行分组。通过内容标签与用户画像标签离线计算推荐内容。

该推荐模式主要包含用户画像建模、用户画像聚类、内容标签、内容推荐四个阶段。

用户画像建模

1、分析业务模型, 建立标签体系, 确定标签取值范围

2、分析标签值的数据来源, 按需收集数据, 计算标签值

3、存储用户画像数据, 并及时更更新

用户画像最终的结果是往往是⼀张表,每行为一个用户的用户画像,存储了用户对应的每个标签值。

例子:

大数据

用户画像聚类

选择合适的聚类算法, 计算每个用户画像的相似度, 为用户分组

常见的聚类算法:

层次化: 最近邻方法, 最远邻方法, 组内聚类法, 组间聚类法, Ward聚类法, 正⼆进制法, 粗聚类算法

划分式: 图论算法, K均值算法, 模糊C均值

基于密度和网格: GDILC 算法, SGC算法, GCHL算法, TFCTMO算法, ST-DBSCAN

其它: ACODF

该部分内容由算法经理主导,作为产品经理不用参与。

内容标签

为了能把内容推荐给用户, 需要为每个内容打上相应的标签, 把内容标签化。

与用户画像类似, 需要根据业务目标来给内容打标签。

内容推荐

主要有三种推荐方法。

1、协同过滤推荐方法

基于用户的协同过滤: 用户A喜欢A内容, 那么跟用户A类似的用户B也喜欢A内容

大数据

基于内容的协同过滤: 用户A喜欢A内容, 那么同样喜欢A内容的用户B喜欢的内容B⽤用户A也喜欢。

大数据

优势:

有效的使⽤用其它用户的反馈信息, 提高准确度

基于用户相似推荐可以发现⽤用户的潜在兴趣, 增加推荐的多样性

劣势:

用户和物品存在冷启动问题, 新⽤用户新内容没有行为数据, 所以无法做出推荐,可解释性不稳定, 因为不对内容做分析, 所以无法根据深层特征和修改来推荐。

相关算法:

关系矩阵及矩阵计算:用户关系 U-U 矩阵、内容关系 V-V 矩阵、用户-内容 U-V 矩阵

基于记忆的协同过滤算法

基于模型的协同过滤算法:基于隐因子模型的推荐算法、基于朴素贝叶斯分类的推荐算法。

2、基于内容的推荐方法:

用户喜欢内容A , 那么跟内容A 类似的内容B 用户也喜欢

优势:

用户间相互独立独立, 只依赖单人偏好

因为内容类似, 所以推荐的内容直观上很容易解释

新内容不存在冷启动问题, 因为只要内容相似就能被推荐

劣势:

对内容标签要求高

不利于挖掘用户的潜在兴趣

存在新用户冷启动问题

3、基于知识的推荐方法:

用大量的数据, 训练专家模型, 用专家来对用户偏好推荐

混合推荐方法: 根据业务场景, 将以上方法进行混合, 优化推荐结果。

并行:

加权式——对多个结果加权计算获得最终结果

切换式——根据场景使用不同的方法

混杂——同时用以上两种

串行:

层叠式——基于⼀个推荐结果再做⼀次推荐

级联式——将⼀种推荐学习到的模型作为另⼀推荐的输入

小结

基于大数据的推荐模式,可以有效实现"千人千面"的推荐模式,为用户不断输送感兴趣的内容,并挖掘用户潜在兴趣点。

对于没有使用的记录的新用户,则采用常规推荐模式,当有了记录后根据用户行为进行大数据推荐。

具体采用怎样的推荐模式,则需要产品经理根据产品特性结合企业的实际技术能力进行选择。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分