컴퓨터 비전 - 이미지 매칭 또는 OCR을 사용하여 텍스트 만 책의 페이지를 인식합니까?

나는 어떤 페이지의 텍스트 만 (이미지 없음) 책인지 알아볼 수 있기를 원합니다. 가장 좋은 접근 방법은 무엇입니까?컴퓨터 비전 - 이미지 매칭 또는 OCR을 사용하여 텍스트 만 책의 페이지를 인식합니까?

처음에는 일종의 이미지 매칭이지만 모든 교과서가 너무 비슷해 보이기 때문에 이것이 얼마나 효과가 있을지 확신 할 수 없습니까?

두 번째 생각은 OCR을 사용하는 것이 었습니까 ??

의견이나 제안 ... 감사합니다!

출처

2011-08-10 bainsey

어떻게이 질문을 받습니까? 샘플 이미지가 있습니까? 이론 상으로는 정말 쉽지만 실제적으로는 매우 어려울 수있는 문제 유형이라고 들립니다. – carlosdc

예 책 페이지의 참조 이미지가있을 것입니다 – bainsey

나는 당신의 경우에 이미지 매칭이 실제로 쓸모가 없다고 생각합니다. 당신이 어떤 페이지인지를 찾고 책에 번호가 매겨진 페이지가 있다면 Tesseract와 같은 OCR을 사용할 수 있습니다.

1) (좌측 상단, 우측, 하단 페이지 번호를 찾아 ..)
2)를 압축 해제()를 복호화하는
(2bis)를 사전 프로세싱을 수행 할 imaget 추출 imaget ...) 당신은 숫자가 표준 인쇄 된 숫자가있는 경우, 후 순간에 볼 수있는 OCR을 사용하지 않으려면
3) 그것을 (사용 정팔 포체 또는 다른 OCR)

을 디코딩 그 (것)들을 인식하기에 확실히 좋을 수있다.

출처

2011-08-11 06:06:34 jmartel

죄송합니다. 위의 내용이 분명하지 않았습니다 ... 조언을 주셔서 감사합니다.하지만 몇 권의 책에 대해 이렇게하고 있습니다. 페이지 번호를 사용할 수 없으므로, 책을 구별하지 마십시오. 또한 Tesseract와 같은 OCR이 표준 도서 페이지를 디코드하는 데 걸리는 시간은 언제입니까? – bainsey

그러면 필요한 것은 실제로 이미지 처리 알고리즘이 아닙니다. 그냥 OCR을 사용하여 전체 페이지를 해독하고, 키워드를 추출한 다음 페이지를 쿼리 할 때 키워드로 데이터베이스를 검색합니다 ... 아주 쉽게 말했지만 어렵게 완료되었습니다 ... – jmartel

감사합니다! 나는 당신이 옳다고 생각하며, 그것을하는 유일한 방법이 아니라면 최선이라고 생각합니다. 전체 페이지를 얼마나 오랫동안 디코딩 할 수 있습니까? – bainsey

컴퓨터 비전 - 이미지 매칭 또는 OCR을 사용하여 텍스트 만 책의 페이지를 인식합니까?

답변

관련 문제