jpg jpeg 또는 다른 형식으로 스캔 한 문서의 텍스트를 가져올 수있는 방법이 있습니까? 내 프로그래밍 언어로 루비를 사용하고 있습니다. 하지만 다른 프로그래밍 언어의 도움을 받아 텍스트를 얻을 수 있다면 통합하는 데별로 문제가되지 않을 것입니다.스캔 한 이미지에서 텍스트 문서 읽기
감사합니다.
jpg jpeg 또는 다른 형식으로 스캔 한 문서의 텍스트를 가져올 수있는 방법이 있습니까? 내 프로그래밍 언어로 루비를 사용하고 있습니다. 하지만 다른 프로그래밍 언어의 도움을 받아 텍스트를 얻을 수 있다면 통합하는 데별로 문제가되지 않을 것입니다.스캔 한 이미지에서 텍스트 문서 읽기
감사합니다.
예, OCR 라이브러리를 사용할 수 있습니다. https://stackoverflow.com/questions/1085/free-ocr-library에 추가 세부 사항이 있습니다.
요약하면 tessnet (http://www.pixel-technology.com/freeware/tessnet2/)을 사용하는 것이 좋습니다.
이 기술을 OCR (광학 문자 인식)이라고합니다.
check out this question은 tesseract-ocr을 권장합니다.
OCR for ruby? check out this question.
두 이미지 만있는 경우 here's a site that supposedly does it for free입니다.
OCR 단자 http://www.ocrterminal.com은 제가 사용한 적어도 12 가지 중에서 가장 (가장 정확한) 무료 도구였습니다. 이것은 형식화 된 (테이블) 데이터와 특히 잘 작동합니다.
온라인 작품입니다. 프로그램의 임베디드 부분으로 사용할 수 없습니다. – sawa
위키 OCR, http : //en.wikipedia.org/wiki/OCR –