欢迎光临散文网 会员登陆 & 注册

批量下载阅读素材

2023-09-20 07:43 作者:_小师傅早  | 我要投稿

昨晚上下载50几个pdf文件,准备打印了给孩子当作阅读素材,拿到链接的时候发现可以单个单个下载,但是没有批量下载按钮,一个一个点按钮实在有点太奇怪了,就用automa写个简单流程,代替手工点击。


因为 automa 这个自动化工具太久没用了,技能生疏了。这里记录一下,备后续查看。


大致流程是这样子的,循环文件列表页,打开每一个文件预览页面,从预览页面的下载按钮点击下载。

循环元素

循环id:这个后面循环内要使用,当前定为 files

css 选择器 :直接用automa自带的css选择器先选一下,尽可能选上级一点,选不出来可以参考 【关系选择器 - 学习 Web 开发 | MDN (mozilla.org)】developer.mozilla.org/zh-CN/docs/Learn/CSS/Building_blocks/Selectors/Combinators#%E4%BD%BF%E7%94%A8%E5%85%B3%E7%B3%BB%E9%80%89%E6%8B%A9%E5%99%A8



获取文本&悬停元素


css选择器语法为:

{{loopData@files}}


loopData是固定写法,files则是前面定义的循环id


悬停元素在此处的作用是触发页面获取预览链接

新标签页打开预览链接

等待1s,并在浏览器打开预览链接

css选择器那段,可以自行调试获得,大于号语法就是 子级 > 子级 ,详细语法参考developer.mozilla.org/zh-CN/docs/Learn/CSS/Building_blocks/Selectors/Combinators


下载文件

悬停的目的还是要获取下载链接

延迟1s后点击下载按钮,可以看到下载成功


切回列表页

切回列表页面,主要是填写一个匹配模式,匹配列表标签页的url链接


循环断点

循环断点这一步很关键,作用是告诉循环体,当前循环在此停住,开启下一次循环。如果不加这个断点,整个循环会就此终止。



整个下载过程事后讲起来也不复杂,我看到这个事情的时候也是觉得,这不就三下两下就搞定了。


可是 automa 毕竟太久没有用了,即便知道流程很简单,可是还是断断续续折腾了2个小时。后续还是要多加练习。


前面处理好打印出的识字卡片,贴满了柜子、墙和门,每天早晚带着娃们读了,坚持 3 个月,希望孩子们能够识字 3000 ,阅读无碍。


最近被 AI 工具惊艳到了,国内同行加油,期待AI 助手早日集成这个能力,发一个文件分享链接给他,把打包下载的文件给我。


AI 聊天的巨大突破,让助手的真人实体化更近一步,期待早日出现像手机一样能力超强、价格低廉、人手一个的 真机器人。



批量下载阅读素材的评论 (共 条)

分享到微博请遵守国家法律