-
[공부 - PG] 오랜만에 다시 Tesseract OCR잡아보는데..2025.02.02 PM 11:49

영수증 읽어들이는 처리를 하고 있는데
PDF파일 주제에 정작 글자가 이미지 처리가 되어 있어서
오랜만에 Tesseract을 다시 돌려보고 있음...
영수증 다도 아니고 한 3포인트만 정확히 잡히면 되는데..
그 부분도 안잡히고 전반적으로 보면 아직도 인식률이 애매하네요
폰트가 한곳에서 나오는 것만 하는 거니
데이터 트레이닝 시키는 거 한번 공부해볼까 생각만 하고 있음..
유료는 퀄리티가 꽤나 좋다는 이야기가 있던데...
돈 쓸만한 작업도 아니고...
여러가지로 애매하네요...
그래도 숫자는 꽤 깔끔하게 읽히네요... 영수증으로써는 다행인가..
댓글 : 0 개