Tesseract 是一个将图像翻译为文字的 OCR 库(光学识别系统, Optical Character Recognition)
1 安装:
Windows
https://code.google.com/p/tesseract-ocr/downloads/list
Linux平台
sudo apt-get install tesseract-ocr
mac平台 brew install tesseract
2 使用
(1) 在终端中调用:
tesseract test.jpg text
(2) 在python代码中使用: 安装python库
pip3 install pytesseract
from PIL import Image
import pytesseract
image = Image.open('test.jpg') # 读取图片
image.rotate(45).show() # 将图片旋转, 并用系统自带的图片工具显示图片
result = pytesseract.image_to_string(image) # 将图像转为文字
print(result)
版权声明:本文为qq_41664822原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。