基于地点相似度的POI推荐以及路径重组【matlab】

2020-08-05 10:22 作者:这个骚年很可耐 0人读过 | 我要投稿

这里设计的POI推荐算法是参考于POI推荐算法，简单来说，就是利用用户访问POI的频次作为POI之间相似度的测度。

具体描述以及代码展示如下：

数据预处理

随机抽取若干行数据

首先我们要进行数据清洗，我们将456967行数据，10000多名用户参与的Gowalla数据进行预处理

为避免数据的偶然性对实验产生的偏差影响，我们在获取数据的同时，随机抽取10000行数据进行实验，代码如下：

生成Excel文件后，按照用户编号升序或者降序排列，因为在下面过滤数据的操作中，需要利用这样的排列结构进行过滤操作

2.数据过滤

过滤掉同一个user_id下，记录少于10行的数据，这样，保留下来的user_id，至少拥有10次访问Poi的签到数据

代码如下：

算法设计

下面来逐行用代码解释算法每一步操作步骤

1）输入地点a, 用户集合X，地点集合Y、用户和地点关系集合
2）找到对a感兴趣的用户子集U；

在我们的实践中，设地点a为poi_id是15693的节点，阈值设为theta=2,即同一个用户访问同一个Poi的次数超过theta，我们可以认为该用户对该poi感兴趣

3）分别找到U中用户感兴趣的地点，组成地点子集A

在这里顺便值得一提的是，在初始化count_1向量时，之所以设置为0.1*ones()矩阵，是因为这巧妙的规避了poi或者是用户编号为0的误差，因为我们之前使用类似功能的any()函数保留了非零元，之后再“四舍五入”，round（）一下，这样原本为0.1的数据依然是0，我们就可以放心的将此零元“过滤掉”（unique函数过滤）