2014-09-06 1 views
-3

나는 단어 "안녕하세요"를 참조하십시오 여기 a-zA-Z0-9를 제외한 메모장 ++ 파일에서 모든 것을 삭제하는 방법은 무엇입니까?

파일

+­«›é¦$6ðbç›4;r6O–0µ<hiñÅÙuµN%\$Õnever in a million yearsþÈWèÁƧÀ[‰võ³°œ»ê"V5n¤ÉÂT‡« 

의 예 .. 이상 시도 이상 읽을 문자 만 찾을 수있는 이상한 물건의 무리와 함께 파일을 대체? 주변에는 "공간"이 없기 때문에 가능하면 삭제해야합니다.

"결코 백만 달러"라는 단어를 보지 마라. 거기에 있어야한다. 다른 모든 것은 삭제되어야한다.

어떻게? 정규식 모드를 사용

답변

0

찾을 :

[^a-zA-Z0-9 ]|((?<![a-zA-Z0-9 ])[a-zA-Z0-9 ]{1,3}(?![a-zA-Z0-9 ])) 

아무것도로 교체하십시오.

결과 텍스트, 샘플 주어진 것 :

never in a million years 지금 당신은 당신이 "단어로 생각"무슨에 대한 임계 값을 설정해야합니다,이 그렇게 간단하지 않다 확인할 수 있습니다. 예를 들어, 위의 정규 표현식에서 길이가 이고 문자가 인 문자열이 모두 지워집니다. (r6O이 제거 된 이유입니다.) 따라서 {1,3} 부분의 두 번째 숫자를 변경하여 필요에 따라 정규식을 조정할 수 있습니다. 예 : {1,4}은 4 이하의 문자가있는 모든 시퀀스를 제거하고 {1, 5}은 5 이하를 제거하는 등의 작업을 수행합니다.

that regex in an online tool을 시도해보십시오. 더 쉽게 미세 조정할 수 있습니다.

+0

완벽하게 작동했습니다. 정말 고맙습니다! <3 –

+0

경기 당 1 줄을 새로 추가하는 방법에 대해 알고 싶습니다. 100000 라인의 어딘가에? –

+0

흠, 잘 모르겠습니다. "매치마다 100000 줄을 추가"한다는 것은 무엇을 의미합니까? – acdcjunior

관련 문제