欢迎光临散文网 会员登陆 & 注册

OpenAI Whisper简单测试

2022-10-15 13:22 作者:bili_29889125298  | 我要投稿

测试环境:

1.Windows 10 企业版

2.Intel Core i3-10100 CPU

3.Python 3.9.13


测试日期:

2022-10-15


测试目的:

1.尝试开源语音识别项目

2.如果可能的话,把自己保存的英文电影加上字幕


安装说明:

1.按照https://github.com/openai/whisper上的说明一步一步来就行

2.git很麻烦,我是直接下载源代码的zip包,解压后执行python setup.py install

3.必须要有ffmpeg,我是用chocolatey下载的

4.第一次运行程序会对应下载模块,tiny包大小72M,base包大小138M

   再大的模块我没有试


测试结果:

1.测试音频I Love Spring Best(网上随便找到的朗读语音)

2.识别率还可以

  单词best,使用tiny模式识别为bed,使用base模式识别为past

  有一个单词plant,发音不太准,使用tiny模式识别为plet,使用base模式识别为pledge

3.速度可以,88秒的音频11秒

4.报错UserWarning: FP16 is not supported on CPU; using FP32 instead,

   但是不影响,应该是需要NVIDIA的显卡加速,我没有显卡,仅用核显UHD 630

5.我看这个项目热度挺高的,估计会有人开发“生成电影字幕”的功能吧,我就躺着等现成的吧,自己不做了

OpenAI Whisper简单测试的评论 (共 条)

分享到微博请遵守国家法律