2011-03-02 2 views
0

나는 대출 신청서를 작성 중입니다. 사용자는 원하는 pdf 또는 doc 은행 명세서를 응용 프로그램에 업로드합니다. 나는/문서를 구문 분석하고 양/체크 번호 등을 삽입해야합니다 ... (내 데이터베이스 구조에 따라) 데이터베이스에.PHP를 통한 PDF/DOC 은행 명세서 문단을 해석하십시오.

같은 결과를 얻으십시오.

+2

어디서 붙어 있습니까? .doc 또는 .pdf 파일 열기? 추출 된 텍스트를 구문 분석합니까? 시도해 봤어? – deceze

+1

이 작업은 많은 작업이 필요하고 완전 자동화에 이르지 못할 수도있는 거대한 * 중요한 작업이라는 것을 알아야합니다. 또한 @deceze는 질문을 위로 나눌 필요가있는 몇 가지 문제가 있다고 말합니다. –

+0

아무 것도 시도하지 않았으므로 시작하는 방법이 필요합니다. –

답변

0

PDF는 내부 데이터로 작동하지 않습니다.

pdftotext 또는 catdoc으로 운이 좋을 수도 있습니다.

0

나는 2 주 이상이 동일한 문제에 대해 작업 해 왔으며, 나는 그것이 상당히 과한 과제라고 말하고있다. 나는 텍스트를 추출하는 PHP 클래스를 찾는 데 성공했지만, 문제는 .pdf 형식의 모든 버전에서 작동하지 않을 것이라는 것입니다. 그리고 자신을 드럼으로 연주하는 것은 인코딩과 압축 문제를 잠깐 생각할 것입니다. 지금은 실제로 파이썬 라이브러리를보고 있습니다. 이 중 하나를 처음부터 작성하는 것은 너무 많은 시간을 소비합니다.

+0

어떤 파이썬 라이브러리를보고 계셨습니까? 그들이 도움이 되었습니까? – pranshus