人人都会用的网页数据爬虫工具 Instant Data Scraper

[[johnny学]] [[新产品体验]]
嗨大家好
我们在前两天的视频里面
用到了这样一个浏览器插件
叫instant data scraper
当时我们拿它去抓取了b站的视频合集的内容
有些同学问他能不能去抓取其他网站的内容
当然是可以的
它是一个通用型的网页爬虫
那我今天演示一下
在edge浏览器里下
我们怎么去安装和使用它
那我们在埃及的扩展里面点这个管理扩展
然后我们点这样的一个链接
在这儿的时候
我们去进行一个搜索
然后我们找到instant data scraper
在这里面呢我们可以在这儿去直接的安装
或者说呢我们去打开它
在这点获取
我们把它给添加上来
好等它添加上来之后呢
如果我们想让它一直显示在这个位置
我们可以去点击这里
然后点这个小眼睛把它显示出来
那我们把这几个不要的页面先给关掉
今天呢我们用豆瓣读书的这个数据
去进行一个演示
那在这里面演示的时候呢
我们先要去点到这个图标
去打开我们这个爬虫的一个页面
好在这里面为了演示的方便呢
我把它放在我们屏幕的右边
然后在这边呢我们放上我们豆瓣的信息
因为豆瓣的这个页面里面的数据呢
它是分页的
所以呢我需要去定位一下我这个下一页的按钮
它在哪里
它也提醒我们了
我们点一下这个图标
然后在这儿呢我们找到后页好
现在我们就已经定位好了
接下来呢我们就可以进行这个爬取
我们去点一下
这个时候你可以看到说左边呢在进行换页
右边一直在进行一个一个的爬取
我们一共有十页
我们只用抓到第十页就可以了
好的那现在我们已经抓住了这十页的内容
而有了这些数据之后呢
我们就可以把它下载
比如说我们现在下载成excel的一个格式
那我们来看一下我们下载成功的
我们这样的一个文件
我们可以用excel去打开好
我们现在去把它打开看一下
那在这里面呢
我们就可以看到说这是我们拿到的数据
那这些数据呢因为是一个规范的excel的数据
你就可以根据你的需求
在下一步决定如何去用它
好的我们就简单分享一下这个插件的使用
希望对你有帮助
我是教你
我们下次见