grep을 stopwords-file과 함께 사용하여 다른 파일에서 일반적인 영어 단어를 걸러 내고 싶습니다. "somefile"파일에는 한 줄에 한 단어가 들어 있습니다. 이는 중지 단어의 단어 somefile 발생 여부를 검사하지만, I는 somefile의 단어 불용어 발생하면 그 반대, 즉 검사 할 :grep을 사용하여 불용어 파일의 단어를 필터링하십시오.
cat somefile | grep -v -f stopwords
이러한 접근에 대한 문제이다.
어떻게 하시겠습니까? 다음
hello
o
orange
중지 단어 포함 : 나는 somefile에서만 단어 "O"를 필터링 할
o
하지
예
somefile에는 다음이 포함 안녕과 오렌지. 당신이 불용어 파일/tmp를/단어가 가정
grep -v -w -f stopwords somefile
또는 'cat' 명령어를 피하는'grep -v -w -f stopwords somefile' – Matthias
클린업 제안에 따라 답변을 변경했습니다. @Matthias –