【数据分享】百度迁徙指数OD版_update_230209
——【基本信息】
数据来源:百度地图迁徙大数据
采集时间:2023年2月14-20日
——【数据说明】
截至2023年2月8日的百度迁徙指数,包括各省、市每日迁入来源地、迁出目的地的结构
【官方注释1】迁徙规模指数:反映迁入或迁出人口规模,城市间可横向对比
【官方注释2】城市迁徙边界采用该城市行政区划,包含该城市管辖的区、县、乡、村
——【关于指数的换算】
做过一个简单测试,用2020年春运期间11天的旅客发送量与同期指数相比
考虑到迁入迁出都算人次,故再折半处理,每1点指数大约对应7万人
——【覆盖天数情况】
2020——47天(1月10日-2月25日)
2021——158天(1月19日-3月8日、9月13日-12月31日)(其中缺11月26日)
2022——130天(1月1日-3月10日、9月1日-10月31日)
2023——39天(1月1日-2月8日)
——【版本划分】
根据处理程度,分为原始结构(00_Scale)、按城市迁徙指数(01_by_City)、按日期迁徙指数(02_by_Date)
具体说明如下,使用前请务必仔细阅读:
——【原始结构(00_Scale)】【116 MB】
——【区划代码_省市类型_省市名称_迁徙方向_scale.txt】
内容:每日迁徙指数结构
处理:未经任何加工,只有比例几乎没法用,需要配合指数(https://www.bilibili.com/read/cv21732064)进行计算
格式:TXT
字段date:8位日期,YYYYMMDD
字段from_city(或to_city):迁入来源城市(或迁出目的城市)
字段from_prov(或to_prov):迁入来源省(或迁出目的省)
字段percent:占当日迁徙指数的百分比(%)
——【按城市迁徙指数(01_by_City)】【149 MB】
——【区划代码_省市类型_省市名称_od_index.txt】
内容:按城市汇总带OD的每日迁徙指数
处理:基于迁徙指数和结构进行计算,并将每个城市迁入、迁出合并为一个文件。由于比例精度低(2位小数),同一个OD在不同城市文件中的指数略有出入,例如20年1月10日廊坊to北京,在北京的文件中数值为21281.0485,在廊坊的文件中数值为21280.3116
—算法:当日指数×比例,扩大10000倍再保留4位小数,以减少精度损失(也为了避免出现科学记数)
—算例1:20年1月10日,北京迁入指数=10.8355644,其中来自廊坊=19.64%,计算后=21281.0485
—算例2:23年2月8日,北京迁出指数=8.1679752,其中去往大庆=0.13%,计算后=106.1837
格式:TXT
字段date:8位日期,YYYYMMDD
字段O:起点城市
字段D:讫点城市
字段index:迁徙指数(注:非原始数量级,经过10000倍放大)
——【按日期迁徙指数(02_by_Date)】【192 MB】
——【YYYYMMDD.txt】
内容:按日期汇总带OD的每日迁徙指数
处理:进一步对同一个OD进行合并,对方向相反的OD进行分组,便于建立无向网络,并将同一个日期的OD合并为一个文件,便于按研究时段汇总
—算法:不同城市文件中的同一个OD指数取平均值
—算例1:20年1月10日,廊坊to北京,(21281.0485+21280.3116)/2=21280.68005
—算例2:23年2月8日,北京to大庆,(106.1837+107.568)/2=106.87585
格式:TXT
字段date:8位日期,YYYYMMDD
字段O:起点城市
字段D:讫点城市
字段index:迁徙指数(注:非原始数量级,经过10000倍放大)
字段pair:OD分组序号(例如:廊坊to北京、北京to廊坊都是1)
——【链接】(有效期:永久)
https://pan.baidu.com/s/1LkOgDreX4BPgjyZq7EyC-A?pwd=7ndu
PS:提取码就写在链接里,直接访问即可,后续数据分享也会采用同一个目录
——【关于转发】
允许二次发布,请注明出处,不得设置额外的获取门槛,包括但不限于转发、集赞(互联网精神)
——【关于赞助】
如果觉得数据集有帮助,并愿意提供支持,欢迎通过爱发电(https://afdian.net/@junhuanliu)订阅我创作的学术文献解析笔记,或直接通过二维码进行捐赠(详见http://junhuanliu.ysepan.com/的【有偿服务说明文档】目录的“收款二维码.jpg”)