UiPath Studio의 Tesseract OCR의 한글 인식하기

20 Nov 2019 • UiPath

UiPath Studio의 Tesseract OCR을 사용 할 때 한국어를 인식 하고 싶은 경우가 있다.

어떻게 하면 한글을 읽을 수 있는지 알아 보자.

일단 아래와 같이 기본적인 Get OCR Text 액티비티로 메모장의 글자를 읽어 보자.

Get Ocr Text Sequence
Get Ocr Text 액티비티의 속성
결과

한글을 인식하지 못하고 잘못된 결과를 반환한다.

한글을 인식하고 싶으면 Tesseract의 kor.traineddata가 필요 하다. 이 파일은 아래 링크에 접속하여 받을 수 있다.

테서렉트 traineddata 파일

한글을 트레이닝한 파일을 받아 UiPath Studio가 설치 된 위치에 tessdata라는 폴더를 만들고 넣어야 한다.

파일위치

그리고 Get OCR Text 액티비티의 속성을 수정하고 실행 해보자

속성수정
실행 결과

한글이 인식되어 나오는것을 확인 할 수 있다.

Comments