Python爬虫案例:采集Tripadvisor数据,全球最大的旅游网站
前言
Tripadvisor是全球领先的旅游网站,主要提供来自全球旅行者的点评和建议,全面覆盖全球的酒店、景点、餐厅、航空公司 ,以及旅行规划和酒店、景点、餐厅预订功能。
Tripadvisor及旗下网站在全球49个市场设有分站,月均独立访问量达4.15亿。


第三方库
requests >>> pip install requests
parsel >>> pip install parsel
开发环境
版 本: python 3.8
编辑器: pycharm 2021.2
开始代码
请求数据
2. 获取数据(网页源代码)
3. 解析数据(提取我们想要的数据内容 详情页链接)
4. 发送请求(访问所有的详情页链接) 获取数据
5. 解析数据
6.保存数据
得到数据

