저는 터미널 프로그램에서 검색 할 수 없었던 내용의 pdf 파일을 가지고 있습니다. Acrobat Reader 및 Skim 만 검색 할 수 있습니다.터미널에서 pdf 파일의 내용을 검색 할 수 없습니다.
어떻게 터미널에서 PDF 파일의 내용을 검색 할 수 있습니까?
그것은 더 나은 질문 검색은 아크로뱃 리더와 탈지로 PDF 뷰어에서 수행되는 방법
것 같다?
아마도 그런 도구가없는 경우 그러한 검색 도구를 만들어야합니다.
저는 터미널 프로그램에서 검색 할 수 없었던 내용의 pdf 파일을 가지고 있습니다. Acrobat Reader 및 Skim 만 검색 할 수 있습니다.터미널에서 pdf 파일의 내용을 검색 할 수 없습니다.
어떻게 터미널에서 PDF 파일의 내용을 검색 할 수 있습니까?
그것은 더 나은 질문 검색은 아크로뱃 리더와 탈지로 PDF 뷰어에서 수행되는 방법
것 같다?
아마도 그런 도구가없는 경우 그러한 검색 도구를 만들어야합니다.
일반적으로 PDF 파일은 압축되어 있습니다. Acrobat Reader 및 Skim과 같은 PDF 뷰어는 PDF 텍스트를 메모리로 압축 해제 한 다음 해당 텍스트를 검색하여 내용을 검색합니다. 명령 줄에서 검색하려면 pdftk을 사용하여 PDF의 압축을 풀고 grep
(또는 원하는 명령 줄 텍스트 검색 유틸리티)을 사용하여 원하는 텍스트를 찾으십시오. 예를 들면 :
# Search for the text "text_to_search_for", and print out 3 lines of context
# above and below each match
pdftk mydoc.pdf output - uncompress | grep -C3 text_to_search_for
pdftotext
은 실제로 훌륭한 도구이지만 매우 긴 선을 생성합니다. grep을하기 위해 그들을 깨고 싶을 것입니다 (예 :
pdftotext drscheme.pdf - | fmt | grep -i spidey