PyQt爬虫综合案例:多线程、QSS
2023-07-18 16:01 作者:矢来美羽MIUYARAI | 我要投稿
通过 PyQt 开发的界面,显示爬虫爬取到的内容。在本章,我们会爬取“Quotes to Scrape”名人名言网站(https://quotes.toscrape.com/)的内容,并将爬虫功能融入 PyQt 开发的界面中,从而开发一款可视化爬取软件,如图 9-1 所示。(参考《PyQt编程快速上手》第9章)

第一步 目标网站分析
“Quotes to Scrape”名人名言网站:https://quotes.toscrape.com/
部分HTML技巧:https://www.bilibili.com/video/BV1d54y1g7db?p=7
打开网页,右键检查,左上角图标:

提取目标为名言、作者、标签的文本,首先是名言的文本:

div标签下的span内部:

因此XPath语句为:
同理,作者和标签的文本:

从而得到:1. crawl.py
第二步 界面布局
确定布局界面,以及使用Qt-Material库来美化界面。
从而得到:2. window.py
使用Qt-Material美化的主程序:3. main.py
第三步 古古怪怪的音效
准备三个音频文件:

音效模块:sound.py
第四步 打包
打包相关知识参考:PyQt完整软件综合案例:登录框
打包后大小为59MB:
