2011-06-10 5 views
3

광 문자 인식 프로그램을 진지하게 고려하고 있습니다. 나는 Java에 정통하며 거기에있는 라이브러리에 대해 알고 싶어합니다. 기본적으로, 나는 다음과 같은 것을 텍스트로 변환하고 싶다. 패턴을 지정하기 위해 수동 중단을해야 할 것입니다. 예를 들어,이 텍스트에서 f를 표시하도록 사용자에게 요청해야합니다. 그러면 f가 어디에서 발생하는지 알 수 있습니다.텍스트 패턴 인식 - Java 기반 시작 위치

enter image description here

나는 전적에 초보자입니다, 그래서 나뿐만 아니라 처음부터 배우는 마음을 해달라고. 지침이 필요합니다.

+0

몇 가지 제안이 [게시물] (http://stackoverflow.com/q/1813881/3009). – highlycaffeinated

+0

OCR을 직접 사용하거나 Java로 이미 존재하는 OCR 소프트웨어를 찾고 계십니까? – Atreys

답변

2

OCR 프로그램을 처음부터 코딩하려는 경우 기술을 읽는 것이 유용 할 수 있습니다. 나는 OCR Survey from 1996이 10 년 반 전의 인기있는 기술 중 일부를 리뷰 한 것을 발견했습니다. 도움이 될만한 독서; 그것을 인용 한 논문이나 논문을 인용하십시오. 다음과 같이

는 일반적으로 프로세스가 진행됩니다

find text 
find characters in the text 
extract features from the characters found 
do pattern matching 
report suspected character 

이미 많은 시간을 절약 할 수있는 주석이 필기의 컬렉션을 찾는 텍스트가 재미 있고 흥미로운 주석 사용자를 받고 있지만, 그런 식으로하면 주석이 달린 텍스트의 데이터베이스를 직접 작성하는 것보다 OCR을 수행하는 것에 집중할 수 있습니다.

약간 더 쉬운 작업으로 시작하려면 필기체 숫자를 감지하는 시스템을 구축하는 것이 좋습니다. USPS는 우편 번호 처리를 위해 시스템을 개발하기 위해 corpus을 생산했습니다. 이 링크는 빠른 검색을 통해 발견 된 것입니다.

+0

[OCR]을 (를) 검색 할 때 http://stackoverflow.com/questions/850717/what-are-some-popular-ocr-gorgorithms도 발견되었습니다. 여기에 링크 된 또 다른 설문 조사가 있습니다. 많은 토론뿐 아니라 – Atreys

+0

링크 및 제안에 많은 도움을 주셔서 감사합니다. – bragboy

2

라이브러리를 사용하고 싶다면 Google이 승인 한 Tesseract을 사용해보세요.