起点月票榜(字体反爬案例)
分析
1.打开月票榜首页

而我的需求是要爬取月票的数据,把鼠标移动到月票数据之上单击,让源码也锁定到相应的位置

可以发现对应位置的标签文本是 “𘠶𘠳𘠳𘠻𘠽𘠳”,这是页面源码的情况,再去看下请求响应回来的是什么

而在在响应源码中,在月票则是一堆乱码,但却很有规律,“𘠶𘠳𘠳𘠻𘠽𘠳”,看到这里很明显就是一个字体反爬,接下来再去看下font有什么有响应

这里有三个响应,不知道它用的是哪个,再回到原来的响应源码把整段复制下来看看,经过分析,目标字体文件的url就是 "https://qidian.gtimg.com/qd_anti_spider/pKfMUHnR.woff " , 一页的字体url都是一样的,只不过这是个动态的数据,每次刷新都会随机从那三个字体响应中选一个引用
分析完毕
代码:
运行结果

