0
데이터베이스로 가져올 데이터가 포함 된 PDF 파일이 있습니다. 파일은 인쇄 된 텍스트의 PDF 스캔입니다. 데이터는이스캔 한 문서에서 데이터 추출 C#
N° Facture : 45526203
Date : 01/12/2014
Nom de la société : company
과 같이 구성되어있다 그러나이 데이터는 항상 내가이 filelds을 인식 할 수있는 도구 또는 API를 원하는 document.So의 같은 지역에 존재하지 않습니다. 모든 조언을 부탁드립니다.
각 행을 읽은 후'Regex.Match (yourLine, RegexString) .Value'로 숫자, 날짜 또는 원하는 형식을 추출 할 수 있습니다. – CAS
https://www.leadtools.com/sdk/ocr /. 그것은 당신이 이미지에서 텍스트를 추출하고 다른 형식으로 출력하실 수 있습니다. 그런 다음 결과를 분석하여 필요한 정보를 분석해야합니다. – Aymeric