Unique in the metro system: The likeliho
Unique in the metro system: The likelihood to re-identify a metro user with limited trajectory points 我发现还是得用这种非手写的形式记笔记,这样方便检索,第二点原因是我发现原来可以直接打上标下标。打字似乎也比手写快一点,缺点是成就感比较少。 阅读原因:同导师的学姐写的且是同一个课题,数据用的可能也相同 2023 Physica A Statistical Mechanics and its Applications 3.3 西南交 Dataset:成都八天地铁卡数据(2021年3月15日至21日,ID,出站时间,出站地点,入站时间,入站地点) Abstract:当时间分辨率为分钟级的时候,三个随机定位点可以识别90%的用户 Introduction:文献[11]利用CDR数据和四个定位点可以实现95%的准确率。 地铁数据只有进站和出站。 本文解决两个问题:第一个是识别唯一用户最少需要多少时空点;第二个是背景知识的范围不同,用户重新识别的概率是多少(?)。 Literature review: 文献[35]用一周的CDR数据以15分钟分辨率和2个数据点分辨了60%用户 文献[14]以一小时分辨率和4数据点分辨90%用户。 这篇论文还进行了灵敏度分析,相关论文从未实践过。 Methodology 使用的模型是Visit Attack[11.31.41] 轨迹截取点位设置多少可以参考论文[31] Results 疑惑:第十八页的图k值甚至可能到28? re-identification risk率就是重新破解用户名的比例[31] figure7图的横坐标不知道是什么,是re-identification risk。 Discussion and conclusion Future:Other attack model、除了进出站更多的信息