특정 제목의 출현을 검색하려는 텍스트 파일 (약 1.5 기가 바이트)이 있습니다. 내 목록에는 약 천만 개의 제목이 있습니다.fgrep은 몇 개의 검색 문자열을 처리 할 수 있습니까?
분명히 목록의 모든 제목이 텍스트 파일에있는 것은 아닙니다. 괜찮아. 텍스트에 어떤 제목이 있는지 알아야합니다.
지금은 몇백 개가 있다면 fgrep
을 사용하여 파일 (예 : fgrep -f patternlist.txt bigtextfile.txt
)에서 검색 문자열을 읽으라고 말합니다.
하지만 많은 데이터에 fgrep
이 걸릴 것입니까?
내 제목 목록과 텍스트 파일을 fgrep
과 함께 사용할 수있는 형식으로 바꾸려면 약간의 작업이 필요합니다. 따라서이 작업을 수행하기 전에 이것이 가능할 지 생각해보십시오.
또 다른 옵션은 제목 목록을 여러 파일로 분할하고 각 하위 목록에 대해 fgrep
을 한 번 실행하는 것입니다. 그것은 합리적으로 많은 수의 검색 문자열을 처리 할 수 있다면 fgrep
을 제공하는 것이 좋습니다. 1 백만 달러를 처리 할 수 있다면 그것은 생각할 필요가 없습니다. 100,000 개를 돌파 할 수 없다면 (100 개 이상의 개별 런을 필요로 함) 덜 매력적인 옵션입니다.
그럼 누구나 매우 많은 수의 문자열을 검색하는 데 fgrep
을 사용한 경험이 있습니까? 그렇지 않은 경우 다른 프로그램을 사용할 수 있습니까? 나는 1-2 일 주어진 나의 자신을 쓸 수 있었다, 그러나 나가 일을 피할 수있는 경우에. . .
왜 그냥 사용해 보지 않으시겠습니까? –
말했듯이, 이것을 시도하기 위해 데이터를 올바른 형식으로 가져 오는 데는 몇 시간의 작업이 필요합니다. 나는 시간을 보내기 전에 다른 누군가가 그것을 시도하기를 바랬습니다. –
Downvoter? 설명 적 설명을 제공하는 것이 일반적입니다. –