airtest识别中文,安装Tesseract-OCR

安装Tesseract-OCR

网上搜素Tesseract,找到Tesseract-OCR的下载链接下载到本地

下载完成后双击进入安装
勾选Additional language data(download)
在这里插入图片描述
点击next,完成安装

添加中文识别包:chi_sim 这个文件。
下载地址:
https://github.com/tesseract-ocr/tessdata
如果你有不明白的可以去官方GitHub看看:
https://github.com/tesseract-ocr/tesseract
下载后把chi_sim 这个文件安装到你的tessdata这个文件夹下面。

注意:需要添加以下环境变量
1.新增环境变量TESSDATA_PREFIX
在这里插入图片描述
2.在path中添加

在这里插入图片描述
完成以上工作后,我们可以在命令行用 tesseract -v 验证环境是否配置成功:
在这里插入图片描述

在本地python环境中安装pytesseract

需要在本地的python环境中安装上 airtest 库和 pytesseract 库:
(建议python采用3.x的版本)

pip install airtest
pip install pytesseract

安装完成后,在命令行输入pip list检查安装结果:
在这里插入图片描述

打开airtest,在 选项–设置–自定义python.exe路径中设置安装好对应库的python环境

在这里插入图片描述

举例

# -*- encoding=utf8 -*-
__author__ = "xxx"

from airtest.core.api import *
from airtest.aircv import *

auto_setup(__file__)

from PIL import Image
import pytesseract

//局部截图
screen = G.DEVICE.snapshot()   //对当前设备画面进行截图并保存在内存中
local = aircv.crop_image(screen,(431,1211,1800,1300))  
// crop_image() ,局部截图的方法,需要传入俩个参数,一个是内存中的截图,就像这里的 screen ,另一个是截取偏移 [x_min, y_min, x_max ,y_max] 

//保存局部截图到指定文件夹中
pil_image = cv2_2_pil(local)
pil_image.save("D:/airtest/test/score0.png", quality=99, optimize=True)

//读取截图并识别截图中的文字
image = Image.open(r'D:/airtest/test/score0.png')
text1 = pytesseract.image_to_string(image,lang='chi_sim')
//lang='chi_sim' 指OCR识别中文的包
print(text1)

版权声明:本文为myinghua原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。