按键精灵识别文字教程
按键精灵识别文字的意义
有时候,仅仅使用找图、找色功能,无法满足某些工作需求。
比如游戏自动交易脚本,是不是要识别交易金额呢?
比如扫描拍卖行价格,是不是要是被数字呢?

这节课,我将教大家如何用按键精灵识别文字的流程。
如果想让按键精灵识别文字,首先我们需要准备字库,字库可以简单理解为字典。
字典存在,让按键精灵有所依据,从而定位文字的内容。
准备工作
大漠插件
大漠插件安装
关于大漠插件的注册、安装,我之前拍摄有教程,感兴趣的朋友可以去看看,请参考OCR文字识别那一集。


这节课的目标,识别终端中的数字,比如我们在终端输入123,则按键精灵会识别出123。

运行大漠综合工具,新建一个字库,这里我使用test.txt为文件名。

按下键盘Ctrl 加 1 或者点击下图按钮,进行抓图。
当我们用鼠标左键,将需要抓图的区域选定后,按下键盘的回车键即可保存。


此时,左侧的预览窗口,会显示刚刚我们截取的图片。

1、在左侧颜色方框中,任意选取一个,将鼠标移动到上面,左键点击一下。

2、点击左上方的预览区域,因为我们需要识别数字,所以将鼠标移动到数字的颜色上面,左键点击一次。

3、此时,大漠综合工具二值化区域会显示识别到的内容。
提示:因为一开始截图范围比较大,所以干扰项也比较多,我们重写截图,弄小一点。

现在,我们可以使用提取点阵功能,将像素做成字库。

提取单个,会将二值化区域所有识别内容,做成一个识别内容。

提取多个,会比较智能的自动识别字符范围,自动拆分。

最关键的一步来了,好好看,好好学。
到目前为止,我们的字库还未做好,因为程序仅仅知道,这是像素组成的图案,并不知道其中文含义。
我们需要手动在定义文字输入框中,打上这个图案代表的中文含义。
这样一来,程序识别到这个图案后,变会理解它是数字1.
记住,打完文字后,一定要按回车键,回车键代表保存。

按下回车键后,字库数量显示1,因为我们存储了一条数据进去。
在“|”符号左侧,也会显示着个图形编码的中文含义。

接下来,就是重复性操作,不断截取图片数字,做出10个数字的识别内容。
为什么要做十个呢?
因为任意长度的数字,都是由这十个长度的字符组成。

当我们做好字库后,第一件事情不是写代码,而是验证。
再次去截取一张图片,看看能否正常识别出字符串内容。
由于我们已经做好字库了,所以二值化区域存在字库内的字符,会自动在3号区域显示其中文含义。
如果数据识别正确,则代表我们的字库做好了。

将制作好的字库,放入按键精灵的附件中。

因为注册大漠插件代码太长,我就放到子程序中了,注册的过程,大家参考OCR文字识别那一期。

现在,我们可以使用ocr命令,识别屏幕上的数字。

这个颜色应该怎么填写呢?
大家请注意,我们一开始的色彩描述,这里就代表字符的颜色。

最后,我们运行了,可以发现按键精灵能正确识别出文字。
小提示:英文字符、标点符号、数字字符、中文字符都可以采用字库的方式进行识别。

识别文字的优势
假设有1万个数字,找图要做一万张图,而识别文字仅需10个字符。