2011-07-26 3 views
1

KOI8_R로 인코딩 된 일부 html을 검색하고 싶습니다. 캐릭터를 훼손하지 않고 어떻게 복구 할 수 있습니까?KOI8_R에서 html 검색

import java.io.*; 
import java.net.URL; 
import java.net.URLConnection; 

public class htmlget { 

    public static void main(String[] args) throws Exception { 
String test = "http://koi8.pp.ru/"; 
     URL website = new URL(test); 
     URLConnection yc = website.openConnection(); 
     StringBuilder fileData = new StringBuilder(1000); 
     BufferedReader in = new BufferedReader(
           new InputStreamReader(
           yc.getInputStream(),"KOI8_R")); 

     char[] buf = new char[1024]; 
     int numRead=0; 
     while((numRead=in.read(buf)) != -1){ 
      fileData.append(buf, 0, numRead); 
     } 
     in.close(); 

     String text = fileData.toString(); 
     BufferedWriter out = new BufferedWriter(
       new OutputStreamWriter(new FileOutputStream("foo.txt"),"KOI8_R"));  
    out.write(text); 
     OutputStreamWriter wrt = new OutputStreamWriter(System.out, "KOI8_R"); 
       wrt.write(text); 
       wrt.close(); 
       out.close(); 
} 

} 

콘솔 및 파일 표시 "ÓÅÇÏÄÎÑ"로 러시아어 문자

답변

0
(...) 
     in.close(); 

     String text = new String(fileData.toString().getBytes(), "KOI8_R"); 
     BufferedWriter out = new BufferedWriter(new OutputStreamWriter(
       new FileOutputStream("foo.txt"), "KOI8_R")); 
     out.write(text); 
(...) 
관련 문제