2009-11-30 3 views
5

Awk에서 UTF8 이외의 인코딩으로 파일을 올바르게 읽으려면 어떻게해야합니까?Awk를 사용하여 다른 인코딩으로 파일을 읽는 방법?

히브리어/Windows-1255 인코딩의 파일이 있습니다. 간단한 {print $ 0} awk는 like와 같은 것을 인쇄합니다. 어떻게 올바르게 읽을 수 있습니까?

+1

awk와 마찬가지로 터미널과 관련이있을 수 있습니다. –

답변

6

awk 자체에는 다른 인코딩 처리에 대한 지원이 없습니다. 환경에 지정된 로케일을 존중하지만 가장 좋은 방법은 입력을 적절한 인코딩으로 코드 변환 한 다음 awk에 전달하는 것입니다.

-f는 변환하려는 형식이고 -t는 대상 형식이며 -c는 iconv의 작업을 중간에 종료하는 잘못된 문자를 건너 뜁니다. 물론 --help가 더 자세한 정보를 제공합니다.

iconv -c -f cp1255 -t utf8 somefile | awk ... 
+0

차가워졌습니다. 감사. (필러 문자 ....) –

관련 문제