“道高一尺,魔高一丈”, Python爬虫与反爬虫的拉锯战!


这波攻势太过凌厉,不过“反爬虫”也不是吃素的,很快,他就找到了“爬虫”的弱点,那就是:访问太过频繁。于是,“反爬虫”马上锁定IP,对那只讨厌的虫子进行了"IP封锁"!

这回该轮到"爬虫"大侠沮丧了,IP被封,意味着不能使用这个IP继续爬取数据了,不过很快,"爬虫"大侠想到了另一个攻击方法:“使用代理IP”,也就是花钱买很多IP,看你能封得过来吗?!

"反爬虫"这回傻眼了,总不能为了赢得这场比武,封掉所有IP吧,这样的话,那些好人也访问不了网站了!“嗯......,怎么办呢?怎么才能识别出这只可恶的爬虫呢?”,有了,“反爬虫”马上就想到了一个好方法:“利用验证码辨别爬虫”,这样,如果是正常人,自然可以填写正确的验证码,而如果是该死的爬虫,呵呵......,于是“反爬虫”马上使出了验证码识别的招数。

"这......",爬虫傻眼了,因为以"爬虫"大侠目前的功力,确实还无法通过自己来识别验证码,“肿么办呢?对了,可以借助第三方云平台识别!”,这回,连“爬虫”大侠自己都佩服自己的聪明才智了!

各种复杂的识别码,都可借助第三方识别!“爬虫”大侠这场比武似乎势在必得!接下来,“反爬虫”大侠该如何应对呢?让我们拭目以待后续更精彩的战况吧......