2009-03-29 4 views
1

저는 터미널 프로그램에서 검색 할 수 없었던 내용의 pdf 파일을 가지고 있습니다. Acrobat Reader 및 Skim 만 검색 할 수 있습니다.터미널에서 pdf 파일의 내용을 검색 할 수 없습니다.

어떻게 터미널에서 PDF 파일의 내용을 검색 할 수 있습니까?

그것은 더 나은 질문 검색은 아크로뱃 리더와 탈지로 PDF 뷰어에서 수행되는 방법

것 같다?

아마도 그런 도구가없는 경우 그러한 검색 도구를 만들어야합니다.

답변

2

시도 MacPorts에서 xpdf를 설치; pdftotext이라는 도구가 있어야하는데, 그러면 grep을 사용하여 검색 할 수 있습니다.

1

일반적으로 PDF 파일은 압축되어 있습니다. Acrobat Reader 및 Skim과 같은 PDF 뷰어는 PDF 텍스트를 메모리로 압축 해제 한 다음 해당 텍스트를 검색하여 내용을 검색합니다. 명령 줄에서 검색하려면 pdftk을 사용하여 PDF의 압축을 풀고 grep (또는 원하는 명령 줄 텍스트 검색 유틸리티)을 사용하여 원하는 텍스트를 찾으십시오. 예를 들면 :

# Search for the text "text_to_search_for", and print out 3 lines of context 
# above and below each match 
pdftk mydoc.pdf output - uncompress | grep -C3 text_to_search_for 
2

pdftotext은 실제로 훌륭한 도구이지만 매우 긴 선을 생성합니다. grep을하기 위해 그들을 깨고 싶을 것입니다 (예 :

)
pdftotext drscheme.pdf - | fmt | grep -i spidey 
관련 문제