2014-11-25 2 views
0

Linux 시스템에서 utf-8로 디코딩하려는 프랑스어 코드 포인트가 있습니다. 내 파일의 내용은 (작은 예)입니다 : 디코딩
문제 : Linux 컴퓨터에서 명령 줄에서 파일 디코딩

Lemari%C3%A9%20

은 다음과 같아야합니다 Lemarié

내가의 iconv이를 달성하기위한 훌륭한 도구가 있음을 읽을 수는 있지만 내가 무엇을 잘 모릅니다 내가 파일 콘텐츠가 인코딩되었으므로 -f 인수로 사용해야합니다. 따라서 iconv -t UTF8 test.csv 옵션 만 시도하면됩니다.조언이 있으십니까?

+0

백분율 기호는 무엇입니까? URL 인코딩 된 텍스트 또는 뭔가 보이는. 파일에 URL 인코딩 된 텍스트가있는 경우 각 백분율 기호가 UTF-8에 의해 개별 문자로 취급 될 것으로 예상됩니다. [위 텍스트에 URL 디코딩] (http://urldecode.org/?decode=Lemari%25C3%25A9%2520) 및 [올바른 UTF-8 바이트 시퀀스가 ​​있어야합니다] (http://hexutf8.com/ ? q = # Lemarié) – jar

답변

1

입력 페이지를 ISO88592 인코딩 형식에서 UTF8 인코딩 형식으로 변환하는 명령은 다음과 같습니다. output은 output.txt 파일입니다. 따라서 귀하의 경우

iconv -f ISO88592 -t UTF8 <input.txt> output.txt 

-f는 입력 파일의 인코딩 형식을 사용해야합니다. Like

iconv -f <input file encoding format> -t UTF8 <test.csv> output.txt 
+0

이것은 이미 나에게 분명했다. 문제는 인코딩 된 문자열을 처리 할 때'-f'로 사용할 char 인코딩 – JBoy

관련 문제