欢迎光临散文网 会员登陆 & 注册

写了一个内嵌字幕转SRT的软件

2023-08-14 18:43 作者:熊大MrBo  | 我要投稿

写在前面:只支持Mac (intel mac不知道行不行)

由于个人的一些需求,在网上查找了各种把内嵌字幕转成SRT的方法,发现步骤繁琐或者就是OCR功能需要花钱。最后发现苹果自带的API可以进行OCR,然后就自己写了个软件来完成我想要的。

先放上地址:https://github.com/shibotong/SRTScraper

目前还没打包因为好像是设置的问题,打包之后每次打开视频文件就崩溃。希望有大佬可以帮忙解决这个问题。

截图

接下来我总结一下我的实现方法

  1. 对于视频每0.1秒截图一次,记录截图的时间

  2. 对于每张图截取字幕部分(红框)

    由于苹果自带的Vision API太强了,如果使用整张图片进行OCR的话就会出现所有的文字,所以自己写用SwiftUI写了个框https://github.com/shibotong/ResizableRectangle。

  3. 对于截取后的图片进行OCR。

  4. 把重复文字的图片的时间拼到一起就可以了

    这里在网上抄了一个String distance的方法来查看和上一段文字的相似度。因为就算是同一句话,两张截图OCR之后的文字也不一定完全一样。

  5. 然后导出到本地就可以了。

这个还有很多不完善的地方,比如说不能选取视频的某段时间来进行识别,不能中途停止,识别完之后不能修改只能倒导出。我是后期用aegisub来进行细修。

目前只能用Xcode打开然后build来用,不知道有没有大佬知道打包之后如何才能打开视频文件

      



写了一个内嵌字幕转SRT的软件的评论 (共 条)

分享到微博请遵守国家法律