2012-03-13 3 views
1

read.table() 명령을 사용하여 스칸디나비아 문자가 들어있는 쉼표로 구분 된 값 파일을 r의 데이터 프레임에 읽으려고하면 올바르게 출력되지 않습니다. 즉, "å", "æ", "ø", "ä"및 "ö"와 같은 문자를 올바르게 포함하고 싶습니다. 지금은 알파벳이 아닌 기호로 표시되며 대개 플로팅과 같은 다른 명령을 사용하여 불평을 일으 킵니다.스칸디나비아 문자를 데이터 프레임에 올바르게 읽음

나는 the ordinary text editor in OS X 내 CSV-파일을 저장하고있어,하지만 난 또한 UTF-8 및 UTF-16과 같은 특정 형식으로 내 파일을 저장, TextWrangler를 사용하여 시도하고 read.table() 명령 내에서 내 인코딩을 지정했습니다 "encoding=" 옵션이 있습니다.

스칸디나비아 문자를 CSV 파일에서 데이터 프레임으로 가져 오는 최소한의 예는 무엇입니까?

답변

4

로캘에 관한 자세한 내용을 포함해야하며 사람들이 가져올 수있는 위치에 샘플을 배치해야합니다. 순간 내 맥 올바르게 문자를 읽는 것 같다 (그리고 나는 그것이 심지어 필요한 로케일 아니에요) : (나는 또한 TextEdit.app로 파일을 만들어 그것은 또한 제대로에서 읽어

> read.table(text='"å", "æ", "ø", "ä"', sep=",") 
    V1 V2 V3 V4 
1 å æ ø ä 
> Sys.getlocale() 
[1] "en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8" 

. 그리고 그들은 음모를 꾸미고에 올바르게 표시) 당신은 fileEncoding 매개 변수를 입력 인코딩을 지정을 시도 할 수 있습니다 :.

> read.table(text='"å", "æ", "ø", "ä"', sep=",", fileEncoding="UTF-8") 
    V1 V2 V3 V4 
1 å æ ø ä 

... 나를 위해 아무것도하지 않습니다 만있는 로케일은 C "로 설정하고 있습니다 경우 "맥을 가진 어떤 사람들에게는 정당한 이유가없는 것처럼 보인다. read.table에 'encoding'매개 변수 만 사용하면 입력 단계에서는 아무 것도 수행하지 않지만 읽기 작업의 결과에만 속성을 할당합니다.

관련 문제