파일에 쓰는 동안 HTML 인코딩을 UTF8로 변환하는 방법?

가능한 중복 :
How can I decode HTML characters in C#?파일에 쓰는 동안 HTML 인코딩을 UTF8로 변환하는 방법?

난 실제 UTF-8로 표현 HTML 인코딩 된 버전 strToCheck 이하 문자열을 변환하는 문제가있다.

// Code sample:  
string result = null; 

// HTML-encoded Input String (From Google Translate API) , renders "भारत महान देश है." in Hindi language. 
string strTocheck = "&#2349;&#2366;&#2352;&#2340; &#2350;&#2361;&#2366;&#2344; &#2342;&#2375;&#2358; &#2361;&#2376;."; 

using (var sw = new StreamWriter(File.Open(@"c:\myfile.txt", FileMode.OpenOrCreate), Encoding.UTF8)) // UTF-8 encoding 
{ 
    sw.WriteLine(strTocheck); 
} 

System.IO.StreamReader reader = new System.IO.StreamReader(@"c:\myfile.txt", Encoding.UTF8); // UTF-8 encoding 
result = reader.ReadToEnd(); 
MessageBox.Show(result); 

// I expected "भारत महान देश है." 
// But got output : &#2349;&#2366;&#2352;&#2340; &#2350;&#2361;&#2366;&#2344; &#2342;&#2375;&#2358; &#2361;&#2376;.

도움이 될 것입니다. 고맙습니다.

여기 이미지 (새 탭에서 열어주세요) >>http://i.stack.imgur.com/xcctU.png

출처

2012-05-30 bharat.chandak100

귀하의 제목에 대한 링크는 매우 잘못된 것입니다. – Joey

'भ'은 ASCII가 아니며 일부 문자의 HTML 인코딩입니다 (코드 포인트 2349). HtmlUnencode 유틸리티를 통해 실행하십시오. –

@ 조이 글쎄, 그 제목 부분을 편집했습니다. ASCII가 UTF-8의 서브 세트라는 것이 옳습니다. 위 이미지를 열면 아이디어를 얻을 수 있습니다. –

그것은이 작동

그냥 예상대로 사용하지 않을 예상대로 : P

을 UTF8 not working in Excel

그리고 http://social.msdn.microsoft.com/Forums/en/csharpgeneral/thread/433ecab8-f800-4376-b351-4bbce93679d9를 참조하는 ASCII는 (실제 인코딩과 문자 집합의 측면에서 모두) UTF-8의 부분 집합이기 때문에 MySQL C# Text Encoding Problems

출처

2012-05-30 15:22:14 Jay

파일에 쓰는 동안 HTML 인코딩을 UTF8로 변환하는 방법?

답변

관련 문제