2012-06-07 4 views
15

nodejs를 사용하여 UTF-16으로 인코딩 된 파일을 읽어야합니다 (크기가 매우 크기 때문에 청크에 있음). 파일의 데이터가 mongodb에 저장되므로 utf-8로 변환해야합니다. 인터넷 검색에서 이것은 노드에 의해 지원되지 않는 단순한 것으로 보이며 버퍼에서 직접 원시 데이터를 변환해야합니다. 그러나 나는 또한 더 좋은 방법이되어야한다고 생각하며 나는 그것을 발견하지 못하고있다. 어떤 제안?nodejs에서 utf-16으로 인코딩 된 파일을 읽으려면 어떻게해야합니까?

감사합니다.

+2

UTF-16에 매우 근접한 ucs2를 지원해야합니다. –

답변

17

노드는 JavaScript에서 지원하는 UTF-16 하위 집합 인 UCS-2를 지원합니다. 그것을 사용해보십시오.

이 부분은 pull request을 참조하십시오.

14

ucs2 텍스트 파일을 읽을 때 당신이하려는 일반 utf8 바꾸기 : 구글,

var fileContents = fs.readFileSync('import.csv','ucs2') 

또한 :이 아마 구문 분석 파일에 나타나는 사람이 추가로 받고 (물음표) 자입니다 문제의 원인. 파일을 UTF16/UCS2로 읽으면 여분의 문자가 사라집니다.

관련 문제