2011-09-20 2 views
8

R을 사용하여 ANSI로 인코딩 된 HTML 파일을 UTF-8로 변환하고 싶습니다.R을 사용하여 파일 인코딩을 변환 하시겠습니까? (ANSI to UTF-8)

이 작업을 수행 할 수있는 도구 또는 도구가 있습니까?

감사합니다.

수정 : o.k, 다른 문제로 좁혀졌습니다. 그것은 여기에 다시 게시됩니다 : 당신의 iconv 사용할 수 있습니다 Using "cat" to write non-English characters into a .html file (in R)

답변

19

:

writeLines(iconv(readLines("tmp.html"), from = "ANSI_X3.4-1986", to = "UTF8"), "tmp2.html") 

tmp2.html이 UTF-8이어야한다.


2015 년 6 월 헨릭에 의해 편집 :
다음과 같이 코멘트에서 증류 된 Windows 용 작업 솔루션입니다 :

writeLines(iconv(readLines("tmp.html"), from = "ANSI_X3.4-1986", to = "UTF8"), 
      file("tmp2.html", encoding="UTF-8")) 
+0

그러나 HTML의 헤더를? 둘 중 하나를 변경하면 안됩니까? – Marek

+0

감사합니다 Kohske,하지만 이것은 나를 위해 작동하지 않습니다. 그것은 파일의 텍스트를 변환하지만 파일 자체가 아닌 이상한 방법으로 변환합니다. 메모장 ++를 사용하여 인코딩을 보았을 때, 여전히 ANSI이고 메모장을 통해서만 + + UTF8로 변경할 수 있습니다 (코드에서 수행하지 않습니다). 어떤 제안? :) –

+2

'from = "CP1252"'를 변경하는 것은 어떻습니까? – kohske

관련 문제