나는 어떤 페이지의 텍스트 만 (이미지 없음) 책인지 알아볼 수 있기를 원합니다. 가장 좋은 접근 방법은 무엇입니까?컴퓨터 비전 - 이미지 매칭 또는 OCR을 사용하여 텍스트 만 책의 페이지를 인식합니까?
처음에는 일종의 이미지 매칭이지만 모든 교과서가 너무 비슷해 보이기 때문에 이것이 얼마나 효과가 있을지 확신 할 수 없습니까?
두 번째 생각은 OCR을 사용하는 것이 었습니까 ??
의견이나 제안 ... 감사합니다!
나는 어떤 페이지의 텍스트 만 (이미지 없음) 책인지 알아볼 수 있기를 원합니다. 가장 좋은 접근 방법은 무엇입니까?컴퓨터 비전 - 이미지 매칭 또는 OCR을 사용하여 텍스트 만 책의 페이지를 인식합니까?
처음에는 일종의 이미지 매칭이지만 모든 교과서가 너무 비슷해 보이기 때문에 이것이 얼마나 효과가 있을지 확신 할 수 없습니까?
두 번째 생각은 OCR을 사용하는 것이 었습니까 ??
의견이나 제안 ... 감사합니다!
나는 당신의 경우에 이미지 매칭이 실제로 쓸모가 없다고 생각합니다. 당신이 어떤 페이지인지를 찾고 책에 번호가 매겨진 페이지가 있다면 Tesseract와 같은 OCR을 사용할 수 있습니다.
을 디코딩 그 (것)들을 인식하기에 확실히 좋을 수있다.
죄송합니다. 위의 내용이 분명하지 않았습니다 ... 조언을 주셔서 감사합니다.하지만 몇 권의 책에 대해 이렇게하고 있습니다. 페이지 번호를 사용할 수 없으므로, 책을 구별하지 마십시오. 또한 Tesseract와 같은 OCR이 표준 도서 페이지를 디코드하는 데 걸리는 시간은 언제입니까? – bainsey
그러면 필요한 것은 실제로 이미지 처리 알고리즘이 아닙니다. 그냥 OCR을 사용하여 전체 페이지를 해독하고, 키워드를 추출한 다음 페이지를 쿼리 할 때 키워드로 데이터베이스를 검색합니다 ... 아주 쉽게 말했지만 어렵게 완료되었습니다 ... – jmartel
감사합니다! 나는 당신이 옳다고 생각하며, 그것을하는 유일한 방법이 아니라면 최선이라고 생각합니다. 전체 페이지를 얼마나 오랫동안 디코딩 할 수 있습니까? – bainsey
어떻게이 질문을 받습니까? 샘플 이미지가 있습니까? 이론 상으로는 정말 쉽지만 실제적으로는 매우 어려울 수있는 문제 유형이라고 들립니다. – carlosdc
예 책 페이지의 참조 이미지가있을 것입니다 – bainsey