2010-04-27 2 views
11

ISO-8851-2로 인코딩 된 텍스트 파일 묶음이 있습니다 (광택 문자가 있음). linux/mac 용 커맨드 라인 도구가 있는데 이것은 쉘 스크립트에서 실행하여 saner utf-8로 변환 할 수 있습니까?XXX에서 utf-8, 명령 행으로 문자 집합 변환

+1

대부분의 경우 ISO-885 ** 9 ** - 2입니다. ISO 8851은 버터에 대해 말합니다. – Melebius

답변

23

iconv -f LATIN1 -t UTF8 

당신은 UTF8//TRANSLIT을 추가 할 수 있습니다 사용합니다.

+4

OSX에서 최소한 utf 인코딩은 UTF-8이라 불리며 명령은 "iconv -f LATIN1 -t UTF-8" –

+0

@ThomasParslow,'iconv -l'는'UTF8'과'UTF-8'을 모두 나열합니다. – lhf

+0

@lfh 어쩌면 오타가 ... 'iconv : UTF8 로의 변환이 지원되지 않음'에서 UTF8 결과를 사용하는 대신 UTF-8이 허용됩니다. 그냥 시도했다. – Paolo

3

GNU 'libiconv'이 작업을 수행 할 수 있어야합니다.

+0

감사! 나는 그것이 내가 생각했던 것보다 쉬울 것임을 알았다! – Marcin

9
recode latin2..utf8 myfile.txt 

이렇게하면 myfile.txt을 새 버전으로 덮어 씁니다. 파일 이름없이 코드로 파이프를 사용할 수도 있습니다. 명령 줄에서

+1

iconv가 -o 또는 출력 경로 재 지정을 사용해도 동일한 파일을 대체하지 않기 때문에 허용 된 응답보다 훨씬 효율적입니다. –