欢迎光临散文网 会员登陆 & 注册

人人都会用的网页数据爬虫工具 Instant Data Scraper

2023-07-02 12:01 作者:酷口家读书会  | 我要投稿

[[johnny学]] [[新产品体验]]

嗨大家好

我们在前两天的视频里面

用到了这样一个浏览器插件

叫instant data scraper

当时我们拿它去抓取了b站的视频合集的内容

有些同学问他能不能去抓取其他网站的内容

当然是可以的

它是一个通用型的网页爬虫

那我今天演示一下

在edge浏览器里下

我们怎么去安装和使用它

那我们在埃及的扩展里面点这个管理扩展

然后我们点这样的一个链接

在这儿的时候

我们去进行一个搜索

然后我们找到instant data scraper

在这里面呢我们可以在这儿去直接的安装

或者说呢我们去打开它

在这点获取

我们把它给添加上来

好等它添加上来之后呢

如果我们想让它一直显示在这个位置

我们可以去点击这里

然后点这个小眼睛把它显示出来

那我们把这几个不要的页面先给关掉

今天呢我们用豆瓣读书的这个数据

去进行一个演示

那在这里面演示的时候呢

我们先要去点到这个图标

去打开我们这个爬虫的一个页面

好在这里面为了演示的方便呢

我把它放在我们屏幕的右边

然后在这边呢我们放上我们豆瓣的信息

因为豆瓣的这个页面里面的数据呢

它是分页的

所以呢我需要去定位一下我这个下一页的按钮

它在哪里

它也提醒我们了

我们点一下这个图标

然后在这儿呢我们找到后页好

现在我们就已经定位好了

接下来呢我们就可以进行这个爬取

我们去点一下

这个时候你可以看到说左边呢在进行换页

右边一直在进行一个一个的爬取

我们一共有十页

我们只用抓到第十页就可以了

好的那现在我们已经抓住了这十页的内容

而有了这些数据之后呢

我们就可以把它下载

比如说我们现在下载成excel的一个格式

那我们来看一下我们下载成功的

我们这样的一个文件

我们可以用excel去打开好

我们现在去把它打开看一下

那在这里面呢

我们就可以看到说这是我们拿到的数据

那这些数据呢因为是一个规范的excel的数据

你就可以根据你的需求

在下一步决定如何去用它

好的我们就简单分享一下这个插件的使用

希望对你有帮助

我是教你

我们下次见


人人都会用的网页数据爬虫工具 Instant Data Scraper的评论 (共 条)

分享到微博请遵守国家法律