[Python]tesseract image에서 문자인식

tesseract image에서 문자인식tesseract 다운로드https://github.com/UB-Mannheim/tesseract/wiki

홈 UB-Mannheim/tesseract WikiTesseract 오픈소스 OCR엔진 (메인리포지터리) – 홈 UB-Mannheim/tesseract Wikigithub.com

위 사이트에 들어가시면 tesseract를 다운받을 수 있는 곳이 있습니다.자신의 환경에 맞는 부분을 찾아 다운로드합니다.

2. tesseract 설치 다운 파일을 더블 클릭으로 실행합니다.

3. 환경설정

C: \Program Files\Tesseract-OCR을 추가합니다.명령 프롬프트 창에서 tesseract 입력 후 아래와 같이 표시되면 정상적으로 설치된 모습입니다.

4. 4. pyteseract, Pillow install python 서에하기해위용다 pyteseract, Pillow 를치합니설사pip4. pip install pyteseract pip install Pillow 5。 パイソン

PIL import Imagepyteseract から pyteseract をインポートします。pytesseract.tesseract_tesseract = r’C:\プログラムファイル\Tesseract-OCR\tesseract.exe’aimg = Image.open(‘test.jpg’)result = pytesseract.image_to_string(aimg, lang=’kor’)print(result)

* test.jpg은 구글에서 영수증으로 검색한 후 무엇이든 이미지로 test.jpg으로 이름을 변경하여 다운로드하여 테스트하였습니다.

생각보다 한글 인식이 떨어지는 것을 확인할 수 있습니다.영어나 숫자는 인식이 좋아요.

error: Content is protected !!