인터넷에서 페이지를 다운로드하는 다운로더 프로그램이 있습니다. 각 페이지의 인코딩이 다르며 일부는 UTF-8이고 일부는 유니 코드입니다. 예 : 'a'문자를 표시하는 a
; 이 문자로 가득 찬 페이지.이 인코딩을 일반 텍스트로 변환해야합니다.UTF-8을 HTML 엔터티의 텍스트로 변환하는 방법은 무엇입니까?
나는 C#에서 UnicodeEncoding
클래스를 사용했지만 도움이되지 않습니다.
어떻게이 인코딩을 실제 문자로 디코딩 할 수 있습니까? 이것을 변환하는 클래스 또는 메소드가 있습니까?
감사합니다.
제쳐두고 : 인코딩이없는 "일반 텍스트"와 같은 것이 없습니다. 강력 추천 : http://www.joelonsoftware.com/articles/Unicode.html – Alex
친애하는, 케니 숙제를하고 질문 제목을 수정하십시오. - UTF8은 유니 코드를 인코딩하는 여러 방법 중 하나입니다. 또한 이것들은 일반 텍스트와 같은 것이 아닙니다. 아마 ANSI 또는 ASCII라고 말하고 싶을 것입니다. 이 경우 데이터 손실 없이는 불가능합니다. – sorin