[python] Tesseract로 OCR 하기


[python] Tesseract로 OCR 하기

OCR(Optocal Charactoer Recognition)OCR 은 Optocal Charactoer Recognition의 약자로 광학 문자 인식을 뜻한다.이미지로부터 텍스트를 인식하고 추출하여 문자로 변환하는 것이다. TesseractOCR을 하는 소프트웨어 중 Tesseract 가 있다.Tesseract는 HP 연구소에서 개발된 오픈소스이고 지금까지도 딥러닝 방식을 통해텍스트 인식률이 지속적으로 증가하고 있다. 설치https://github.com/tesseract-ocr/tesseract/wiki자신의 OS에 맞춰서 설치한다.Windows라면 비트 환경 맞춰서 다운설치 시 아래의 이미지에서부터 추가를 해줘야 하는 것이 있다.기본적으로 설치할 때 언어팩이 영어로만 설치가 되기 때문에한국어도 추가해주어야 한..........



원문링크 : [python] Tesseract로 OCR 하기