2008-08-05 7 views
25

현재 프로젝트를 진행하고 있으며 내 목표는 이미지에서 텍스트를 찾는 것입니다. 텍스트를 OCR하는 것은 아직 내 의도가 아닙니다. 기본적으로 이미지 내의 텍스트 범위를 가져 오려고합니다. 나는 조작을 위해 AForge.Net 이미징 구성 요소를 사용하고 있습니다. 어떤 의미에서 도움이 되었습니까?이미지 내에서 텍스트 찾기

업데이트 2/5/09 : 이후 내 프로젝트에서 다른 경로를 따라갔습니다. 그러나 MODI (Microsoft Office Document Imaging)를 사용하여 텍스트를 가져 오려고했습니다. 이미지를 OCR하고 텍스트를 쉽게 가져올 수 있습니다.

답변

12

이것은 활발한 연구 분야입니다. 말 그대로 주제에 관한 학술 논문들이 있습니다. 그것은 당신에게 특히 더 많은 deatails 승/지원을 제공하기 어려울거야. 특정 유형의 텍스트를 찾으십니까? 글꼴? 영어 전용? 학술 문헌에 익숙하십니까?

"텍스트 감지"는 모든 OCR (광학 문자 인식) 시스템의 표준 문제이므로 결과적으로 인터 롤을 다루는 많은 코드가 있습니다.

Google에서 링크 더미를 나열 할 수는 있지만 '텍스트 감지'에 대한 검색을 수행하고 독서를 시작할 것을 제안합니다. :) 사용 가능한 충분한 예제 코드가 있습니다.

3

이미지 내부의 텍스트를 인식하는 것은 실제로 그 분야의 연구자에게 가장 중요한 주제이지만 captcha's이 스팸 봇에 대한 방어면에서 "표준"이되었을 때 제어가 어려워졌습니다. 왜 captcha를 보호 수단으로 사용합니까? 글쎄, 이미지 안에 텍스트를 위치시키고 (그리고 읽을 때) 매우 힘들었 기 때문에!

captcha를 언급하는 이유는 그 작은 영역 내에서 가장 발전이 이루어 졌기 때문이며, 귀하의 솔루션이 거기에서 가장 잘 발견 될 수 있다고 생각합니다. 특히 captcha는 어수선한 이미지 내부에 텍스트 (또는 텍스트와 유사한 텍스트)를 배치하고 나중에 문자를 올바르게 읽으려고하기 때문에.

그래서 당신은 찾을 수 있다면 자신 a good open source captcha breaking tool 당신은 아마 당신이 그 OCR 년대를 읽는 데 사용되기 때문에
당신은 아마, 문자 인식 자체를 처리하는 가장 dificult 코드를 버릴 수 ... 당신의 탐구를 계속하는 데 필요한 모든이 왜곡 된 텍스트, 당신이 할 필요가없는 것.

* :이에 대한 온라인 API를 사용하여와 확인을 경우에 "비 연구원"

+0

입니다. captcha를 언급하는 또 다른 이유는 아마도 그의 "프로젝트"가 무엇인지입니다. :-) –