3

개인 프로젝트를 위해 일부 일본어 웹 사이트를 긁어 내려고하고 있습니다. UTF-8 텍스트가 포함 된 사이트는 예상대로 완벽하게 작동하지만 다른 국제 인코딩을 지정하는 사이트, 특히 EUC-JP에서 텍스트를 가져올 수 없습니다. 노드 또한 원시를 전달하지 않고 텍스트를 해석하고 수정하는 것 같습니다. 응답을 ASCII 및 BINARY로 해석하도록 설정 한 다음 내 터미널 응용 프로그램을 EUC-JP로 설정하려고했지만 console.log()을 수행 한 후 , 실제 텍스트의 결과도 표시되지 않습니다.Node.JS에 EUC-JP 및 기타 일본어 텍스트 인코딩로드 중

나는 노드 문서를 통해 검색을 했어, 그리고 단지 두 가지 텍스트 인코딩을 지원하는 것 (바이너리와 64 기수 그렇다.)

나는 붙박이 HTTP 클라이언트를 사용하고, 인코딩을 지정하고있어 response.setEncoding 방법을 통해 response.setEncoding('utf8');

다른 사람들은 노드의 국제 텍스트를 어떻게 사용합니까? (특히 원래 데이터가 UTF-8이 아닌 상황과 관련하여) 바이너리 버퍼가 유일한 방법입니까?

약간의 연구를 해봤지만 문자 인코딩에 관해서는별로 지식이 없기 때문에 간단한 답변을 부탁드립니다. 감사!

답변

2

iconv bindings to node.js을 추가하는 모듈이 있습니다. 응답을 바이너리 Buffer으로 잡는 경우 Iconv.convert을 사용하여 EUC-JP에서 UTF-8로 변환 할 수 있습니다 (예를 들어 README보기).

+0

감사합니다. 큰 도움이됩니다. – Christopher

관련 문제