2023深兰交大AI算法班第五期
常见推荐规则和算法
推荐算法最常见的是物品相似和用户共同喜好相似。
拿最初亚马逊卖书举例,物品相似就是如果你购买或者搜索了某一本书,它会根据之前提取的该书的特征,比如作者,图书分类,推荐同一作者或同一门类的其他图书给你。其实一个简单的基于规则推荐系统效果已经很惊艳了,而且这种推荐一般不会出来你完全不感兴趣的东西。
通过比较用户相似做的推荐就稍有趣一点,基本原理是A用户和B用户的购买记录和行为类似,归为同类客户,那么A用户记录里买过ab两本书,B目前只买了a一本书,那系统就可能把b那本书也推荐B用户。这种规则能发现一些潜在的兴趣点,但由于分类的问题,也可能推荐出你完全不感兴趣的东西。
用户共同喜好原理的一个延申是用户画像。购物网站会记录用户的一系列行为形成数据链记录:登录,搜索、浏览、选择商品、页面停留时间、评论阅读、是否关注促销,以及加入购物车、下订单、付款、配送方式,最终是否有售后和返修。通过行为提炼或者通过三方数据库,年龄、性别、地域、购物习惯,是否已婚,是否有孩子,对促销是否敏感等都被记录在用户画像上。
早期的这两种方法实现都基于规则设置,做一些数据挖掘,根据挖掘结果设置一些规则。这些规则都是易于理解的,就像在书店,书会按照门类或者作者陈列。
推荐算法里还有一种思路接近搜索算法,根据用户搜索记录的关键字,推荐和这些关键字相关的其他搜索结果中的物品。
亚马逊率先推出协同过滤思想,之后电商都是采用几种算法共同作用的结果,除了以上三种,常见的还基于一些用户行为的假设,比如:
曾经浏览过但没有下单的物品
按照周期性推荐,比如洗衣粉,纸巾等。
推荐一些卖得好的流行品