2017-09-08 1 views
-2

저는 PDF 및 사진을 처리하기위한 OCR 솔루션을 찾고 있습니다. 처리 된 텍스트는 특정 데이터를 가져올 수있는 방식으로 해석되어야하므로 일부 필드와 연결할 수 있습니다. 업로드 된 PDF 및 이미지에는 항상 필요한 모든 데이터가 포함되지만 템플릿/레이아웃은 다를 수 있습니다. 내가 줄 수있는 가장 좋은 예는 청구서를 처리하고 회사 이름, 실행 한 저작물, 재정적 세부 사항 등을 표시하는 것입니다.OCR 라벨 일치

나는 이미 훌륭한 OCR 인 Tesseract를 조사했지만 어떤 레이블을 추출 할 수 있는지 모르겠습니다. 그것에서. 나는 '레이아웃 분석'이 내가 찾고있는 것이라고 생각하지 않는다, 그렇지? 또한 Tesseract는 아래 요구 사항에 대해 작동하지 않습니다.

  • 기존 HTML 5 웹 사이트에 자바 스크립트로 작성
  • IOS와 안드로이드 응용 프로그램 :

    문서 처리에 통합 될 필요가있다. 앱이 작동하려면 인터넷 연결이 필요하지 않습니다. 모든 처리는 오프라인에서 장치 자체에서 이루어져야합니다. 앱은 백엔드에서 실행되는 교육을 기반으로 '업데이트'할 수 있습니다.

저는 오픈 소스 및 유료 솔루션을 모두 찾고 있습니다.

+2

질문 [** On-Topic **] (https://stackoverflow.com/help/on-topic)과 [** On-Topic **] (https :// /www.stackoverflow.com/help/dont-ask) – Nope

+0

나는 비슷한 요구를 가지고있다. 그것은 큰 질문이다. OCR은 특히 스마트 장치의 새로운 기능입니다. 찾은 모든 것을 공유하십시오. 좋은 질문을 게시 해 주셔서 감사합니다. – Jeb50

답변

0

온라인 OCR API 솔루션으로 시작하는 것이 좋습니다. 한 곳에서 비교할 수있는 몇 가지 좋은 것들이 있습니다 : Google Cloud Vision vs Microsoft Azure vs free OCR.space.

이 중에서 OCR.space는 PDF 스캔을 지원하는 유일한 파일입니다.

OCR SDK는입니다. 매우입니다.하지만 비싸지 만 Abbyy입니다.

+1

꽤 좋은 비교. 세로 모양의 이미지가 있습니다. 업로드 한 후 가로 세로 90도 회전 **하여 모든 영어 단어가 수직으로 나타납니다. 그래도 .space는 MS보다 훨씬 뛰어나며 Google은 거의 모든 95 %의 정확도를 읽을 수있어 탁월한 승자입니다. – Jeb50