2009-07-04 3 views
1

나는 그것이 무엇을 말하고 싶지 않고 보안 문자와 같은 왜곡을 다루지 않을 것입니다. 단지 묶음에 텍스트가 들어 있는지 알고 싶습니다.

빠른 문자 감지

이것은 유휴 리눅스 서버에서 실행될 것이며, 크론 작업은 하루에 여러 번 이미지를 대량으로 처리합니다.

내가 처리하고자하는 일 중 하나는 텍스트가있는 이미지를 버리는 것입니다. 몇 가지 오 탐지는 신경 쓰지 않지만 가능하면 삭제해야하는 텍스트가있는 이미지를 식별 할 때 제로 퍼센트 실패율에 근접하고 싶습니다.

답변

2

Tesseract-OCR은 Google 도서에서 Google이 사용하는 것입니다. 시도 해봐.

+0

내가보기에 조금 무거워 보이지만 나는 아무것도 찾을 수 없으면 다시 돌아올 수 있습니다. :) – joebert