2015-01-21 2 views
0

데이터베이스로 가져올 데이터가 포함 된 PDF 파일이 있습니다. 파일은 인쇄 된 텍스트의 PDF 스캔입니다. 데이터는이스캔 한 문서에서 데이터 추출 C#

N° Facture : 45526203 
Date : 01/12/2014 
Nom de la société : company 

과 같이 구성되어있다 그러나이 데이터는 항상 내가이 filelds을 인식 할 수있는 도구 또는 API를 원하는 document.So의 같은 지역에 존재하지 않습니다. 모든 조언을 부탁드립니다.

+0

각 행을 읽은 후'Regex.Match (yourLine, RegexString) .Value'로 숫자, 날짜 또는 원하는 형식을 추출 할 수 있습니다. – CAS

+0

https://www.leadtools.com/sdk/ocr /. 그것은 당신이 이미지에서 텍스트를 추출하고 다른 형식으로 출력하실 수 있습니다. 그런 다음 결과를 분석하여 필요한 정보를 분석해야합니다. – Aymeric

답변

0

ABBYY Cloud OCR SDK에서 처리 할 수 ​​있습니다.
processTextField 메서드를 사용하여 텍스트 필드를 인식합니다.
자세한 내용은 ABBYY's website에서 확인할 수 있습니다.
도움이 필요하면 주저하지 말고 의견을 말하십시오. (저는 ABBYY에서 일합니다).