Tesseract 图像识别引擎

Tesseract 是一个将图像翻译为文字的 OCR 库(光学识别系统, Optical Character Recognition)

1 安装: 

Windows
https://code.google.com/p/tesseract-ocr/downloads/list

Linux平台

sudo apt-get install tesseract-ocr
mac平台
brew install tesseract 

2 使用

(1) 在终端中调用:

tesseract test.jpg text
(2) 在python代码中使用:

        安装python库

pip3 install pytesseract
from PIL import Image
import pytesseract
image = Image.open('test.jpg') # 读取图片
image.rotate(45).show() # 将图片旋转, 并用系统自带的图片工具显示图片
result = pytesseract.image_to_string(image)  # 将图像转为文字 
print(result)




版权声明:本文为qq_41664822原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。