2012-10-13 3 views
0

Excel에서 내보내고 영어 및 러시아어 이외의 문자가 모두 포함 된 CSV 문서가 있습니다.Ruby CSV에서 다국어 문서로 Excel 구문 분석

나는

CSV.open @tmp, "rb:ISO-8859-1", {col_sep: ";"} 

로 엽니 관리했지만 내가 시도 "RB : ISO-8859-1 : UTF-8"한 등 \xCE\xF1\xF2\xE0\xEB\xFC\xED\xFB\xE5 \xE7\xE0\xEF\xF7 로 러시아어 문자를 읽을 수 있지만 "하면 ArgumentError를 얻을 수 : UTF-8의 잘못된 바이트 시퀀스 ", 모드없이 실행 된 csv.open과 동일합니다.

어떻게 수정 될 수 있습니까? 또한 '모드'인수 옵션을 찾는 방법 - 설명 된 위치에서 문서의 내용을 이해할 수 없습니다.

주요 환경은 우분투 서버입니다.

답변

1

r:ISO-8859-15:UTF-8 
+0

감사합니다이 형식을 사용해보십시오. 데이터를 저장할 때 고객의 지역에 맞게 조정 된 것처럼 보입니다. 여러 파일의 경우 CP-1251이 정상적으로 작동합니다. 원본 인코딩을 추측하기 위해 파일을 테스트하는 방법을 잘 모릅니다. – lifecoder

관련 문제