欢迎光临散文网 会员登陆 & 注册

简单爬虫笔记

2023-07-11 09:29 作者:便宜酒  | 我要投稿

步骤:

>导包

    pip3 install requests

    pip3 install bs4


>伪装成浏览器请求资源

找到User-Agent


    >分析静态资源标签

        以阿B首页分区为例


    要爬取的是div标签下的class为channel-items_left的标签里的a标签里target为_blank的内容需要两个循环

    >

    结果


    简单爬虫笔记的评论 (共 条)

    分享到微博请遵守国家法律