OpenAI Whisper简单测试
2022-10-15 13:22 作者:bili_29889125298 | 我要投稿
测试环境:
1.Windows 10 企业版
2.Intel Core i3-10100 CPU
3.Python 3.9.13
测试日期:
2022-10-15
测试目的:
1.尝试开源语音识别项目
2.如果可能的话,把自己保存的英文电影加上字幕
安装说明:
1.按照https://github.com/openai/whisper上的说明一步一步来就行
2.git很麻烦,我是直接下载源代码的zip包,解压后执行python setup.py install
3.必须要有ffmpeg,我是用chocolatey下载的
4.第一次运行程序会对应下载模块,tiny包大小72M,base包大小138M
再大的模块我没有试
测试结果:
1.测试音频I Love Spring Best(网上随便找到的朗读语音)
2.识别率还可以
单词best,使用tiny模式识别为bed,使用base模式识别为past
有一个单词plant,发音不太准,使用tiny模式识别为plet,使用base模式识别为pledge
3.速度可以,88秒的音频11秒
4.报错UserWarning: FP16 is not supported on CPU; using FP32 instead,
但是不影响,应该是需要NVIDIA的显卡加速,我没有显卡,仅用核显UHD 630
5.我看这个项目热度挺高的,估计会有人开发“生成电影字幕”的功能吧,我就躺着等现成的吧,自己不做了