2011-09-21 3 views
0

내 회색 머리카락이 터져 나오기 시작 했어.많은 파일을 파싱하고 데이터를 새 파일로 추출 하시겠습니까?

나는 선을 추출하려는 400 개의 PDF 파일을 가지고 있습니다. 줄은 DIR로 시작하고 숫자가 이어집니다. 하지만 파일 이름도 필요합니다!

그래서 누구든지 PDF를 구문 분석 (또는 내가 txt로 변환 할 수 있음) 한 다음 용어를 검색하고 확장하여 파일 이름을 추가하고 새 파일에 저장하는 방법을 알고 있습니다.

도움이 될 것입니다!

감사합니다,

토르

+0

PDF 파일을 TXT로 변환 할 수 있습니까? 그렇다면 그 파일의 예를 게시하고 필요한 것을 더 잘 설명하십시오. 우리는 당신을 도울 것입니다 – Marco

+0

PDF 파일을 TXT로 변환해야한다면 [this] (http://www.somepdf.com/some-pdf-to-txt-converter.html)를 시도해 볼 수 있습니다 : 무료로 보입니다. 30 일 동안 ... – Marco

답변

0

당신은 당신이 PDF 파일을 열기 위해 사용할 수있는 iText를 라이브러리를 가지고있다. 패턴별로 각 pdf를 스캔해야합니다. 라이브러리 링크 www.itextpdf.com

관련 문제