python如何识别图片中的文字
python如何识别图片中的文字,这里给个案例并附上详细步骤:
模块包的安装:
1、安装PIL:pip install Pillow
2、安装pytesser3:pip install pytesser3
立即学习“Python免费学习笔记(深入)”;
3、安装pytesseract:pip install pytesseract
4、安装autopy3:
先安装wheel:pip install wheel
下载autopy3-0.51.1-cp36-cp36m-win_amd64.whl【点击打开链接】
执行命令:pip install E:�安全浏览器下载utopy3-0.51.1-cp36-cp36m-win_amd64.whl
5、安装Tesseract-OCR:百度直接搜索Tesseract-OCR下载即可
这里要说明的是安装Tesseract-OCR后,其不会被默认添加至环境变量path中
解决办法有两种:(先找到Tesseract-OCR安装文件夹,再找到tesseract.exe文件)
我这里的绝对路径是:D:pythonTesseract-OCR esseract.exe
①将此路径添加至环境变量path中(不过我是这么做的,但是PyCharm仍旧报错)
②找到pytesseract.py文件
我这里是C:UsersdminAppDataLocalProgramsPythonPython36Libsite-packagespytesseractpytesseract.py
将文件中的tesseract_cmd修改为上方的绝对路径
进入正题,如何识别图像中文字
上原图:(这句是海上钢琴师中的一句经典台词)
接下来我们要通过python的pytesseract来识别图片中的字符了
# _*_ coding:utf-8 _*_import pytesseractfrom PIL import Image__author__ = 'admin'im = Image.open(r'C:UsersdminDesktopexample.png')print(pytesseract.image_to_string(im))
效果图