2012-02-28 2 views
7

OCR 관련 내용을 이해할 수 없습니다. 필자는 .jar 파일을 Eclipse로 가져 와서 이미지 (.bmp, .tiff, .jpeg)를 입력 할 수 있어야하며 이미지의 텍스트 내용이 포함 된 문자열을 출력해야합니다. captcha 나 필기체가 아니라 단순히 문자로 된 간단한 "사진"입니다.JAVA OCR API open-source on eclipse

오픈 소스 솔루션을 높이 평가합니다. 나는 Tess4j 또는 JavaOCR 같은 프로젝트를 보았다 그러나 그들은 약간은 누구나 제안을 가지고 :(

처리하기 위해 복잡

이 업데이트 :?. 나는 AspriseOCR 사용하기가 매우 쉽다는 점을 발견했습니다 단지에 .JAR을 가져 빌드 경로와 메서드를 호출합니다. 아주 좋습니다.하지만 ... 내 프로젝트에서는 사용할 수 없습니다. 라이브러리를 Asprise처럼 간단하게 알고 있습니까 (컴파일 할 필요가 없습니다. 교육 :. 그냥 가져 그거야!) 당신은 javaocrsourceforge.net/projects/ajol를 살펴있을 수 있습니다

+0

다음을 확인하십시오. http://stackoverflow.com/questions/1813881/java-ocr-implementation 및 http://asprise.com/product/ocr/index.php?lang=java – Favonius

+0

1) -출처? OCR에 대해 "이해하지 못하는 사람"*이 코드를 변경하거나 확장 할 수 있다고 제안합니까? 아니면 실제로 '자유'를 의미합니까? 2) '자바'는 대문자가 하나 뿐이며 'JAVA'라고 쓰여진 약어가 아니라 적절한 이름입니다. 3) 'Greetings N'과 같은 소리를 남기지 마십시오. –

+2

답변 해 주셔서 감사합니다. 1) 오픈 소스는 도서관을 살 돈이 없어서입니다! 코드를 확장하고 싶지는 않지만 내 모바일 앱 중 하나에서 사용할 수 있습니다. 2) 나는 영어가 "모국어"가 아니므로 약간의 실수를 할 수 있습니다. 죄송합니다. 3) 항상 예의 바르게하려고 노력합니다. – nunoaac

답변

9

로 전 네이티브 opensource Java OCR SDK가 없다는 것을 알고 있어야합니다. Tesseract (http://groups.google.com/group/tesseract-ocr/) - tesjeract (http://code.google.com/p/tesjeract/) 또는 Tess4J (http://tess4j.sf.net/)와 같은 Java 래퍼가 있습니다. 가장 일반적인 오픈 소스 OCR 엔진 중 하나 인 경우와 같이 기본 인터페이스에 대한 호출을 래핑하는 Java API가 있습니다. 그것은 당신을 위해 일할 수 있지만, 설치하는 것이 다소 어렵고 당신 편에서 이미지 사전 처리와 폰트 훈련을 개발해야 할 것입니다.

하나 더 해결책은 클라우드 서비스 일 수 있습니다. 최종 사용자 응용 프로그램에 인터넷 연결이 필요하지만 프로그래밍 언어 선택 및 리소스 제한과는 독립적입니다. http://ocrsdk.com을 보면 웹 기반 API를 통해 이미지를 업로드하고 OCR 된 데이터를 반환하는 클라우드 기반 OCR SDK입니다. 이 웹 API 기반 OCR SDK는 무료가 아니기 때문에 적합하지 않을 수 있습니다. 그러나 엔터프라이즈 급 솔루션을 제공하면서 기업용 솔루션과 비교할 때 가격이 매우 저렴하므로 무료 평가판을 사용해보십시오. OCR 정확성은 오픈 소스보다 훨씬 낫습니다. 이 Java codesample github에서 유용 할 수도 있습니다. Disclamer : 나는 ABBYY를 일한다.

+0

ABBYY는 OCR 된 데이터를 얻기 위해 PDF 파일 (스캔 한 문서 일 수도 있음)을 업로드 할 수있게합니까? – Dax

5

지금까지