pytesser模块WindowsError错误解决方法

在使用pytesser做图片文字识别时遇到 WindowsError: [Error 2] 错误,报错内容如下:

Traceback (most recent call last):  File”E:/Code/Captcha/ChinaMobileEC/recogCaptcha.py”, line37,inprintpytesser.image_to_string(out)  File”E:\Code\Captcha\pytesser\pytesser.py”, line36,inimage_to_string    call_tesseract(scratch_image_name, scratch_text_name_root)  File”E:\Code\Captcha\pytesser\pytesser.py”, line25,incall_tesseract    proc = subprocess.Popen(args)  File”C:\Python27\lib\subprocess.py”, line710,in__init__    errread, errwrite)  File”C:\Python27\lib\subprocess.py”, line958,in_execute_child    startupinfo)WindowsError: [Error2]

WindowsError: [Error 2] 的意思是系统找不到指定的文件。

加群923414804免费获取数十套PDF资料,助力python学习

查看pytesser中的代码,其实就是一个调用 tesseract.exe 识别图片的过程,其中代码如下:

tesseract_exe_name =’tesseract’defcall_tesseract(input_filename, output_filename):”””Calls external tesseract.exe on input file (restrictions on types),

    outputting output_filename+’txt'”””args = [tesseract_exe_name, input_filename, output_filename]    proc = subprocess.Popen(args)    retcode = proc.wait()ifretcode !=0:        errors.check_for_errors()

就是调用 subprocess.Popen() 执行 tesseract input_filename output_filename, 这样会将识别结果写到out_filename的txt文件。这条命令你可以直接在cmd中到 tesseract.exe 目录下运行,也能看到识别结果。pytesser其实就是调用这个命令识别,然后读取结果返回。

所以上面错误中所说的找不到的文件就是指 tesseract.exe。所以解决这个问题的方法有两种:

第一种时将 tesseract.exe 所在路径添加到搜索路径,这样无论在哪儿执行 tesseract 系统都能找到。

第二种是修改 pytesser 中的代码, 将 tesseract 换成绝对路径即可:

importospwd = os.path.dirname(__file__)# 将原来的 tesseract_exe_name=’tesseract’ 改成绝对路径tesseract_exe_name = os.path.join(pwd,’tesseract’)

    原文作者:派派森森
    原文地址: https://www.jianshu.com/p/d414c1095038
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞