Windows安装Tesseract-OCR与python扩展包实现提取图片文字

it2022-05-09  64

windows 10安装Tesseract-OCR

下载安装包 https://digi.bib.uni-mannheim.de/tesseract/

下载后是一个exe安装包,直接双击安装即可,安装完成之后,配置一下环境变量,编辑 系统变量里面 path,添加自己的安装位置 选择安装路径

添加环境变量

将刚才的安装路径添加到path里 新建一个环境变量,名称是TESSDATA_PREFIX,值是安装路径下的tesseract文件夹路径 测试 命令行输入 tesseract -v,出现版本信息则安装成功

安装python扩展包

需要安装两个包

pip install pillow #一个python的图像处理库,pytesseract依赖 pip install pytesseract

python 测试 原图片

from PIL import Image import pytesseract import cv2 as cv img_path='F:/fb/xxx.jpg' # 不依赖opencv写法 text=pytesseract.image_to_string(Image.open(img_path)) print(text)

成功识别 手写一个数字 结果识别失败,可见tesseract的识别准确率还是很低的


最新回复(0)