2011-01-22 8 views
2

나는 제어 할 수없는 소스에서 얻은 텍스트 파일에서 어떤 텍스트 내용이 주기적으로 바뀌고 다시 다운로드하고 처리하여 보완해야하므로 char U + FFFD는 자주 발생하지만 작은 따옴표 또는 '문자입니다.대체 작업을 수행하기 위해 U + FFFD를 인코딩하는 방법은 무엇입니까?

U + FFFD를 C#의 실제 작은 따옴표로 바꾸려면 대체 작업을 어떻게 인코딩 할 수 있습니까? 내가 좋아하는 뭔가를 구상 :

string s = s.Replace("U+FFFD", "'"); 

분명히 내가 문자를 다루는 과부하를 사용해야합니다,하지만 나는 U + FFFD 인코딩, 또는 그 문제에 관해서는, 단일 인용하는 방법을 잘 모르겠습니다!

+1

덧붙여서, 이것은 잘못된 charset wrangling (서버 측 일 가능성이 있음)의 특징입니다. [U + FFFD는 '대체 문자'입니다 (http://www.fileformat.info/info/unicode/char/fffd/index.htm). – dkarp

+0

그럴 가능성은 있지만, 아무것도 할 수있는 것은 없습니다. 내가하는 모든 작업은 텍스트 파일로 다운로드하여 모양을 처리해야합니다. – Cyberherbalist

+0

문자열 "U + FFFD"를 "foo"와 같은 다른 문자열처럼 바꾼다 –

답변

6
string s = s.Replace('\uFFFD','\''); 
+0

빠른 응답을 보내 주셔서 감사합니다! 오늘 아침에 나에게 많은 용기를주었습니다! – Cyberherbalist

+0

기꺼이 도와 드리겠습니다. – tenor

관련 문제