epub文件的漫画资源,提取图片时的顺序整理方法
记录一下之前遇到的问题,其实这个和epub文字小说排序也是差不多原理。
希望能帮到遇到同样问题的人,这边也会简单讲下原理。
前几天下载漫画资源想放到电脑上看,但是发现资源格式是epub格式的。
虽然电脑上可以用wps打开,手机上也可以用那种有带小说阅读器的插件打开。
但是观感还是特别蛋疼,因为不能随意放大缩小。
所以我想过将图片都提取出来。
其实epub格式就是一个整合包,里面包含了所有的网页资源。如图:

如果是漫画资源的话,所有的图片都在image文件夹内。
但是直接打开的话就会发现里面所有的图片顺序都是乱的,并不能正常的阅读。

而html文价夹中的html文件打开所见的才是正序。

打开每个html文件可获得到那张对应次序的图片的url,也就能锁定图片的文件名

那么其实只需要获取每一个html文件中的图片名,再将其对应的图片文件改为对应的html的文件名就可以做到整理其顺序。
这里我找到了以前一位遇到同样问题的大佬给写的脚本(捡到现成的了嘿嘿,不用自己动手了
链接:https://github.com/powersee/epub-image-rename/blob/master/rename.py

原理其实很容易理解,用python运行这段代码。
需要注意的是string_in_html那里需要填写的是图片名字的共有部分并且是在“-”之前的部分。比如我这里需要填写的就只是vol

之前就差点误解了这段注释里写的意思==
最后结果:

就可以愉快的又舒心的直接看漫画了~~