windows 10安装Tesseract-OCR
下载安装包 https://digi.bib.uni-mannheim.de/tesseract/
下载后是一个exe安装包,直接双击安装即可,安装完成之后,配置一下环境变量,编辑 系统变量里面 path,添加自己的安装位置 选择安装路径
添加环境变量
将刚才的安装路径添加到path里 新建一个环境变量,名称是TESSDATA_PREFIX,值是安装路径下的tesseract文件夹路径 测试 命令行输入 tesseract -v,出现版本信息则安装成功
安装python扩展包
需要安装两个包
pip install pillow
pip install pytesseract
python 测试 原图片
from PIL
import Image
import pytesseract
import cv2
as cv
img_path
='F:/fb/xxx.jpg'
text
=pytesseract
.image_to_string
(Image
.open(img_path
))
print(text
)
成功识别 手写一个数字 结果识别失败,可见tesseract的识别准确率还是很低的