다음과 같은 파일이 있습니다.개행 문자를 제외한 모든 단어가 아닌 문자를 제거하려면 어떻게해야합니까?
my line - some words & text
oh lóok i've got some characters
'정규화'하고 모든 비 단어 문자를 제거하고 싶습니다. 나는 다음과 같이 끝내고 싶다.
mylinesomewordstext
ohlóokivegotsomecharacters
나는 현재 명령 행에서 리눅스를 사용하고 있으며, 내가 사용할 수있는 한 줄짜리 줄이 있기를 바라고있다.
나는 이것을 시도했다 :
cat file | perl -pe 's/\W//'
하지만 모든 줄 바꿈을 제거하고 모든 것을 한 줄을 넣었다. 펄이 \W
에 개행 문자를 포함하지 않는다고 말할 수 있습니까? 아니면 다른 방법이 있습니까?
이렇게하면 원본 텍스트에 악센트 부호 o가 표시됩니다. –
유니 코드 인식을 얻으려면 명령에 플래그를 추가해야합니다. -C해야합니다. http://perldoc.perl.org/perlrun.html#Command-Switches –
오른쪽으로 변경했습니다. – sth