欢迎光临散文网 会员登陆 & 注册

通过网络爬虫实现批量自动下载天文观测证认图(PAN-STARRS1和SDSS为例)

2023-03-23 17:38 作者:爱天文的同学  | 我要投稿

目录

  • 前言

  • 爬虫程序PAN-STARRS1示范

    • 一、导入依赖包

    • 二、读取本地星表

      • 提取星表中的RA和DEC

    • 三、生成对应的PAN-STARRS1图像网站

    • 四、爬虫伪装浏览器

    • 五、批量爬虫

  • 下面是SDSS DR16示范,解释同上

    • 一、二程序不变

    • 三、生成对应的SDSS DR16图像网站

    • 四、爬虫伪装浏览器

    • 五、批量爬虫

  • 结语

前言

如果你有很多需要观测的天体,需要在观测计划中陈列相应的证认图,或者你有很多感兴趣的天体,想看看他们的图像,那这篇文章或许对你有用。


SDSS DR16和PAN-STARRS1证认图网站的爬虫为例,这两个望远镜并不能观测全天,但可以在光学波段观测大部分天区了,其他望远镜的网站爬虫程序可以参考本程序改写。


相应的观测网站通过输入RADEC坐标得到相应的图像,因此本爬虫也通过自己星表的RA和DEC来识别输入。

参照本文可以通过Python实现自动爬取大量天体的证认图,从网站中提取证认图网站,自动下载到本地并保存为图片格式


爬虫程序PAN-STARRS1示范

一、导入依赖包

二、读取本地星表

如果是fits文件可以导入astropy来读取

提取星表中的RA和DEC

三、生成对应的PAN-STARRS1图像网站

这里根据PAN-STARRS1的网站构造,根据每个天体的RA和DEC生成相应的网站

我这里只用到了g和z波段的数据,有需要更多波段的只需要将其它波段选上,然后把相应网站的后半部分替换例子中的即可

四、爬虫伪装浏览器

五、批量爬虫

下面是SDSS DR16示范,解释同上

一、二程序不变

三、生成对应的SDSS DR16图像网站

四、爬虫伪装浏览器

五、批量爬虫

结语

当需要下载大量图像或数据的时候,一个一个手动输入RA和DEC肯定是不现实的,像这样的简单爬虫就可以帮到我们。

需要注意的是: 有些网站是有反爬虫机制的,需要进一步调用time、selenium等包操作来加强伪装。如果网站方不允许的话我们还是应该遵守他们的规则。


通过网络爬虫实现批量自动下载天文观测证认图(PAN-STARRS1和SDSS为例)的评论 (共 条)

分享到微博请遵守国家法律