사전에는 대문자와 문자가 아닌 문자 및 남유럽에서 사용 된 이상한 문자가 포함됩니다. "è"라고 말하십시오.
"A"와 "a"를 구별하려면 "A"와 "a"가 같은 문자 인 경우 자동으로 수행되며 ALL grep
호출시 -i
옵션을 사용해야 만 grep
은 대소 문자를 무시합니다.
다음으로, 당신은 항상 소위 backslashitis 당신이 grep
에 전달하려는 정규 표현식에를 근무력증 방지하기 위해 -E
옵션을 전달하려는.
은 출력에서 정규 표현식과 일치하는 행을 제외하고 올바른 옵션은 -v
입니다. 단일 grep
호출에 여러 가지 정규 표현식에를 지정하려면
결국,이 방법 (BTW 단지 예)
예선은 우리를있는
grep -E -i -v -e 'regexp_1' -e 'regexp_2' ... -e 'regexp_n'
, 대답을 사용,의 앞으로 살펴 보자입니다 chiastic-security에서 procedings을 이해하는 기준으로
가 단지 이러한 가능성 5 문자열에 중복을 찾을 수 있습니다
,(.)\1
(.).\1
(.)..\1
(.)...\1
grep -E -i -e 'regexp_1' ...
지금 당신은 모든 복식을 가지고 있지만, 이것은 다음과 같은 패턴으로 식별하는 등 트리플을 배제하지 않는다
(.)\1\1
(.).\1\1
(.)\1.\1
(.)..\1\1
(.).\1.\1
(.)\1\1\1
(.).\1\1\1
(.)\1\1\1\1\
(편집 추가 일치의 cople이 패턴을 세 배로 추가) 당신이이 패턴을 제외 할 , 그 시점에서 너무 grep -E -i -v -e 'regexp_1' ...
, 당신은 단어의 목록을 가지고 당신이 더블 더블을 삭제하려면 적어도 같은 문자의 몇없이 트리플 등,이 더블 더블
(.)(.)\1\2
(.)(.)\2\1
(.).(.)\1\2
(.).(.)\2\1
(.)(.).\1\2
(.)(.).\2\1
(.)(.)\1.\2
(.)(.)\2.\1
일치하는 정규 표현식에 있으며 이 패턴 라인을 제외하려면 당신이 원하는 그 grep -E -i -v ...
마지막 힌트 있도록 압도하는 피하고, 당신이 정말 당신이 무슨 일을하는지 이해할 수 있도록, 당신의 작업 디렉토리에 head -n 3000 /usr/share/dict/words | tail -n 300 > ./300words
을 사전의 몇 백 개 라인을 복사 내 대답과 함께 재생 출력의 부피만큼.
예, 이것은 완전한 대답은 아니지만 너무 많을 수 있습니다. 그렇지 않습니까?
아마도 당신과 http://stackoverflow.com/questions/26789662/bash-script-pipes-not-working가해야 이것에 함께 일하십시오. =) 허용한다고 가정합니다. –