tesseract image에서 문자인식tesseract 다운로드https://github.com/UB-Mannheim/tesseract/wiki
홈 UB-Mannheim/tesseract WikiTesseract 오픈소스 OCR엔진 (메인리포지터리) – 홈 UB-Mannheim/tesseract Wikigithub.com
위 사이트에 들어가시면 tesseract를 다운받을 수 있는 곳이 있습니다.자신의 환경에 맞는 부분을 찾아 다운로드합니다.
2. tesseract 설치 다운 파일을 더블 클릭으로 실행합니다.
3. 환경설정
C: \Program Files\Tesseract-OCR을 추가합니다.명령 프롬프트 창에서 tesseract 입력 후 아래와 같이 표시되면 정상적으로 설치된 모습입니다.
4. 4. pyteseract, Pillow install python 서에하기해위용다 pyteseract, Pillow 를치합니설사pip4. pip install pyteseract pip install Pillow 5。 パイソン
PIL import Imagepyteseract から pyteseract をインポートします。pytesseract.tesseract_tesseract = r’C:\プログラムファイル\Tesseract-OCR\tesseract.exe’aimg = Image.open(‘test.jpg’)result = pytesseract.image_to_string(aimg, lang=’kor’)print(result)
* test.jpg은 구글에서 영수증으로 검색한 후 무엇이든 이미지로 test.jpg으로 이름을 변경하여 다운로드하여 테스트하였습니다.
생각보다 한글 인식이 떨어지는 것을 확인할 수 있습니다.영어나 숫자는 인식이 좋아요.