2012-05-30 2 views
0

가능한 중복 :
How can I decode HTML characters in C#?파일에 쓰는 동안 HTML 인코딩을 UTF8로 변환하는 방법?

난 실제 UTF-8로 표현 HTML 인코딩 된 버전 strToCheck 이하 문자열을 변환하는 문제가있다.

// Code sample:  
string result = null; 

// HTML-encoded Input String (From Google Translate API) , renders "भारत महान देश है." in Hindi language. 
string strTocheck = "भारत महान देश है."; 

using (var sw = new StreamWriter(File.Open(@"c:\myfile.txt", FileMode.OpenOrCreate), Encoding.UTF8)) // UTF-8 encoding 
{ 
    sw.WriteLine(strTocheck); 
} 

System.IO.StreamReader reader = new System.IO.StreamReader(@"c:\myfile.txt", Encoding.UTF8); // UTF-8 encoding 
result = reader.ReadToEnd(); 
MessageBox.Show(result); 

// I expected "भारत महान देश है." 
// But got output : भारत महान देश है. 

도움이 될 것입니다. 고맙습니다.

여기 이미지 (새 탭에서 열어주세요) >>http://i.stack.imgur.com/xcctU.png

+2

귀하의 제목에 대한 링크는 매우 잘못된 것입니다. – Joey

+3

'भ'은 ASCII가 아니며 일부 문자의 HTML 인코딩입니다 (코드 포인트 2349). HtmlUnencode 유틸리티를 통해 실행하십시오. –

+0

@ 조이 글쎄, 그 제목 부분을 편집했습니다. ASCII가 UTF-8의 서브 세트라는 것이 옳습니다. 위 이미지를 열면 아이디어를 얻을 수 있습니다. –

답변

관련 문제