0
가능한 중복 :
How can I decode HTML characters in C#?파일에 쓰는 동안 HTML 인코딩을 UTF8로 변환하는 방법?
난 실제 UTF-8로 표현 HTML 인코딩 된 버전 strToCheck 이하 문자열을 변환하는 문제가있다.
// Code sample:
string result = null;
// HTML-encoded Input String (From Google Translate API) , renders "भारत महान देश है." in Hindi language.
string strTocheck = "भारत महान देश है.";
using (var sw = new StreamWriter(File.Open(@"c:\myfile.txt", FileMode.OpenOrCreate), Encoding.UTF8)) // UTF-8 encoding
{
sw.WriteLine(strTocheck);
}
System.IO.StreamReader reader = new System.IO.StreamReader(@"c:\myfile.txt", Encoding.UTF8); // UTF-8 encoding
result = reader.ReadToEnd();
MessageBox.Show(result);
// I expected "भारत महान देश है."
// But got output : भारत महान देश है.
도움이 될 것입니다. 고맙습니다.
여기 이미지 (새 탭에서 열어주세요) >>http://i.stack.imgur.com/xcctU.png
귀하의 제목에 대한 링크는 매우 잘못된 것입니다. – Joey
'भ'은 ASCII가 아니며 일부 문자의 HTML 인코딩입니다 (코드 포인트 2349). HtmlUnencode 유틸리티를 통해 실행하십시오. –
@ 조이 글쎄, 그 제목 부분을 편집했습니다. ASCII가 UTF-8의 서브 세트라는 것이 옳습니다. 위 이미지를 열면 아이디어를 얻을 수 있습니다. –