欢迎光临散文网 会员登陆 & 注册

2023深兰交大AI算法班第五期

2023-06-18 14:25 作者:一起学习fee1024  | 我要投稿

常见推荐规则和算法

推荐算法最常见的是物品相似和用户共同喜好相似。

拿最初亚马逊卖书举例,物品相似就是如果你购买或者搜索了某一本书,它会根据之前提取的该书的特征,比如作者,图书分类,推荐同一作者或同一门类的其他图书给你。其实一个简单的基于规则推荐系统效果已经很惊艳了,而且这种推荐一般不会出来你完全不感兴趣的东西。

通过比较用户相似做的推荐就稍有趣一点,基本原理是A用户和B用户的购买记录和行为类似,归为同类客户,那么A用户记录里买过ab两本书,B目前只买了a一本书,那系统就可能把b那本书也推荐B用户。这种规则能发现一些潜在的兴趣点,但由于分类的问题,也可能推荐出你完全不感兴趣的东西。

用户共同喜好原理的一个延申是用户画像。购物网站会记录用户的一系列行为形成数据链记录:登录,搜索、浏览、选择商品、页面停留时间、评论阅读、是否关注促销,以及加入购物车、下订单、付款、配送方式,最终是否有售后和返修。通过行为提炼或者通过三方数据库,年龄、性别、地域、购物习惯,是否已婚,是否有孩子,对促销是否敏感等都被记录在用户画像上。

早期的这两种方法实现都基于规则设置,做一些数据挖掘,根据挖掘结果设置一些规则。这些规则都是易于理解的,就像在书店,书会按照门类或者作者陈列。

推荐算法里还有一种思路接近搜索算法,根据用户搜索记录的关键字,推荐和这些关键字相关的其他搜索结果中的物品。

亚马逊率先推出协同过滤思想,之后电商都是采用几种算法共同作用的结果,除了以上三种,常见的还基于一些用户行为的假设,比如:

曾经浏览过但没有下单的物品
按照周期性推荐,比如洗衣粉,纸巾等。
推荐一些卖得好的流行品

所以推荐算法和其他机器学习相关的算法不太一样,早期通过规则,用户行为研究等已经取得了不错的效果,机器学习时代带来了一些算法工具,比如使用Apriori和FP-Growth算法进行关联分析,但本质上的改变并不大,但因为机器学习算法能处理的数据量大大增加,对计算能力要求变高,所以在推荐算法领域也又很多关于大数据存储,离线计算,计算实时性等的技术领域。


2023深兰交大AI算法班第五期的评论 (共 条)

分享到微博请遵守国家法律