撸一波免费视频素材
写在前面呀:
最近老有做视频剪辑的朋友问我薅视频素材的问题,个人还是支持正版的,也热衷支持知识产权保护。不过有些网站,就不点名了,搜到的人应该都会懂,其实明明就是薅的别人素材,然后上传到自己网站上,打上自己域名的水印,就开始要求用户充VIP才能下载,心里默默的爆着粗口,脑子里一万只草泥马,然后手上也握着草。强烈建议有这种网站的VIP的同学提供一下账号,去薅了他们的素材,因为没有VIP账号能抓取到的数据有限,而且网站提供的下载接口也不一样。
用到的环境和工具:
Pyhon 3.8.10
Pycharm
windows11
今天要采集的网站是----(写在代码里吧,不然B娘又以为我在发广告,然后不让我的文章展示)。视频网站一般是没有所谓的json数据接口的,因为都是薅羊毛,又不是大公司,要做书规范,所以还是从浏览器渲染的网页入手:
网页视频列表页,F12(好像没什么新鲜的);
提取视频列表页的视频播放页(这个页面如果有视频下载地址也是缩略图,不清晰的那种);
对播放页面信息提取,如标题和下载地址;
代码开始:
代码采集所有页面,一个页面32条,应该将近900条视频,所以,进行多线程。
需要注意的是,视频标题处理,一整个网站,可能存在标题重名的视频,在保存到本地的时候,很容易被覆盖,会产生数据条数表少的情况。前面写过一篇帖子,发现采集完后数据少了很多,其实就是视频标题的问题,可能产生了覆盖。
程序运行截图:

视频保存部分截图:

打完收工,如果对在看的你有帮助,点个赞呗。如果对代码有问题,请在评论区留言,我会在第一时间回复你的。
申明:本文仅用于学习和交流使用,不接受任何形式的传播。请支持正版视频,维护支持产权。