2012-12-22 1 views
0

첨부 된 이미지를 보면 이미지 + 텍스트가 있음을 알 수 있습니다. 내가 원하는 것은이 이미지를 잘라내어 그 부분을 포함하는 텍스트가 분리되고 나머지가 버려지는 방식으로이 이미지를 자르는 것입니다. 어떻게해야합니까? enter image description here?포함 된 텍스트를 분리하여 이미지를 자르려면?

+1

포토샵.! . :) –

+0

이 작업의 최첨단 기술은 F- 점수가 70 % 미만이므로이를 염두에 두어야합니다. 당신은 당신의 업무를 단순화 할 필요가 있으며, 귀하의 경우에는 단순화가 가능합니다. 전체 이미지 또는 브라우저에서 텍스트를 추출 하시겠습니까? 브라우저 창만 유지하십시오. 이제이 사이트에 직접 액세스 할 수 있습니다. 생성 된 html을 파싱하여 텍스트 전용 버전을 만드는 것이 훨씬 간단합니다. 그런 다음 개별 이미지를 가져 와서 개별적으로 작업하여 텍스트를 추출하십시오. – mmgp

답변

0

당신이 원하는 것은 매우 어렵습니다. 이미지 인식 라이브러리를 사용하면 시작할 수는 있지만 일관성있는 결과를 얻으려면 매우 어려울 것입니다. 이런 종류의 문제는 연구 영역으로 넘어갑니다. 여기에 도움이 될 블로그 포스트는 다음과 같습니다

http://rmtheis.wordpress.com/2011/08/06/using-tesseract-tools-for-android-to-create-a-basic-ocr-app/

+0

맞습니다. tesseract에 대해 이미 작업하고 있는데, tesseract가 이미지의 텍스트 부분 만 인식하는 경우 이미지의 일부분 만 인식하고 그렇지 않으면 쓰레기를 반환합니다. 이미지의 컬러 부분을 지우는 방법은 http://stackoverflow.com/questions/11678542/image-processing-for-ocr-with-leptonica-inverse-color-text?rq=1에 나와있는 것처럼 텍스트 부분 만 남겨 두는 것입니다. –

관련 문제