2012-05-16 3 views
0

ADO를 사용하는 것 외에도 VB6을 사용하여 PDF 파일에서 데이터를 추출하는 다른 방법이 있습니까? Acrobat Reader를 사용하지 않고 VB6를 사용하여 PDF 파일을 성공적으로 열었지만 프로젝트의 다음 단계에서는 PDF 파일을 읽고 데이터를 찾아야합니다. 예를 들어 "시멘트"라는 단어가 나오는 페이지는 무엇입니까?PDF 파일을 읽는 방법

+1

오류, ADO 및 PDF ?? – Deanna

+1

PDF 파싱은 분명히 매우 까다 롭습니다 (http://stackoverflow.com/questions/1251956/is-there-a-pdf-parser-for-php). 분명히 PHP에 대한 것이지만, 복잡성). 그 사이에 : VB6 ?! – halfer

+0

여기를 보셨나요? http://stackoverflow.com/questions/7784235/read-pdf-file-contents-in-vb – thejartender

답변

1

일반적으로 외부 라이브러리를 사용해야합니다. 순수한 VB 솔루션 (즉, 텍스트 파일로 읽고 파일을 읽음)은 일주일 만에 얻을 수있는 것이 아닙니다.

자동화를 통해 Adobe Acrobat을 사용할 수 있습니다. 시작을위한 예는 예를 들어 http://www.freevbcode.com/ShowCode.asp?ID=7066. 그러나 Adobe Reader만으로는 충분하지 않으므로 전체 Acrobat이 정말로 필요합니다. 다른 인기있는 PDF 읽기 라이브러리 (예 : poppler)가 있지만 VB6에서 사용하는 데 어려움을 겪을 수 있습니다.

일반적으로 성공 가능성은 "추출"이 의미하는 바에 달려 있습니다. 간단히 말해서, PDF는 메타 정보가없는 순수한 설명 형식입니다. 나는. 파일에는 "A를 (x1, y1)에 넣고 (f2 '에") 넣는 것과 같은 지침이 있습니다. 테이블이나 구조화 된 정보를 읽으려면 엄청난 양의 경험적 발견이 필요합니다.

최선의 방법은 추출하려는 데이터를 더 적합한 데이터 형식 (일반 텍스트, XML 등)으로 가져 오는 것입니다.