어떻게 Perl의 CAM::PDF을 사용하여 PDF 문서의 첫 번째 단락을 추출 할 수 있습니까?어떻게 Perl의 CAM :: PDF를 사용하여 PDF 문서의 첫 번째 단락을 추출 할 수 있습니까?
1
A
답변
0
일반 PDF는 실제로 마크 업 언어가 아닙니다. 텍스트는 특정 위치에 그려집니다. Tagged PDF이라는 이름의 문서가 있고 문서에 태그가 추가되면 작업이 쉬울 수도 있습니다.
텍스트 변환기가 PDF를 통해 문서를 실행하고 텍스트가 PDF가 아닌 텍스트의 텍스트로 저장되는 경우 텍스트의 첫 번째 청크를 얻는 경향이 있습니다.
1
print CAM::PDF->new('file.pdf')->getPageText(1);
페이지의 텍스트가 모두 표시됩니다. 그러나 CAM :: PDF는 확실히이 특정 작업에 가장 적합한 도구는 아닙니다 (저는 저자입니다). 나는 텍스트 추출을 단지 내가 할 수 있는지 알아보기 위해 변덕으로 추가했다.
관련 문제
- 1. Perl의 CAM :: PDF는 Annotation 객체를 집계 할 수 있습니까?
- 2. CAM :: PDF를 사용하여 비례 텍스트를 파싱 할 수없는 이유는 무엇입니까?
- 3. 문자열의 첫 번째 x 단락을 반환하십시오.
- 4. 펄을 사용하여 PDF 페이지를 이동하는 방법 (CAM :: PDF, PDF :: API2)?
- 5. Doxygen에서 만든 PDF 문서의 여백을 어떻게 바꿀 수 있습니까?
- 6. 문서의 첫 번째 열을 제거하려고합니다.
- 7. PHP를 사용하여 문자열의 첫 번째 단어를 추출
- 8. PHP에서 PDF로 - XML 문서의 텍스트를 사용하여 PDF를 만드시겠습니까?
- 9. CAM :: PDF를 사용하여 텍스트 문자열의 너비와 높이를 얻으려면 어떻게해야합니까?
- 10. perl의 pdf 파일 읽기
- 11. 구분 된 문자열에서 첫 번째 토큰 추출
- 12. 프로그램의 첫 번째 실행을 어떻게 감지 할 수 있습니까?
- 13. 목록의 첫 번째 위치에 어떻게 추가 할 수 있습니까?
- 14. Perl의 객체를 어떻게 조롱 할 수 있습니까?
- 15. 는 문자열에서 첫 번째 단어 추출 - 정규식
- 16. jQuery를 사용하여 PDF를 생성 할 수 있습니까?
- 17. JasperReports는 보고서에 pdf를 포함 할 수 있습니까?
- 18. Google API를 사용하여 PDF를 PNG로 변환 할 수 있습니까?
- 19. 위키 백과 페이지의 첫 번째 단락을 다듬는 방법은 무엇입니까?
- 20. 어떻게하면 PDF 파일에서 이미지를 추출 할 수 있습니까?
- 21. Swing 응용 프로그램에서 iText를 사용하여 PDF를 렌더링 할 수 있습니까?
- 22. jmeter - PDF를 렌더링 할 수 있습니까?
- 23. 정규식 : 첫 번째 단 하나의 모든 단락을 일치하십시오
- 24. 어떻게 DirectShow를 사용하여 비디오에서 프레임을 추출 할 수 있습니까?
- 25. 어떻게 Perl을 사용하여 여러 줄을 추출 할 수 있습니까?
- 26. Perl의 WWW :: Mechanize를 사용하는 페이지를 제외한 모든 링크를 페이지에서 어떻게 추출 할 수 있습니까?
- 27. 석영을 사용하여 pdf 문서의 텍스트를 검색하는 방법
- 28. Perl의 마지막 배열 요소에서 첫 번째부터 다섯 번째까지를 어떻게 인쇄 할 수 있습니까?
- 29. PDF 문서의 항목 이동
- 30. 안드로이드에서 pdfbox를 사용하여 PDF 문서의 내용을 표시하는 방법