답변
간단한 해결책은 문자열에서 모든 비 ASCII 문자를 제거하는 것입니다. - 필요하지 않을 수 있습니다 여기에 정규식을 사용하여
로 언급하지만string s = "�Click me.";
s = Regex.Replace(s, @"[^\u0000-\u007F]", "");
,이 인코딩/코드 페이지 문제가 될 수 있습니다 : this question에서이 가능 할 수있는 몇 가지 방법 아마 것 간단한있는이있다 적절한 해결책.
편집 : 귀하의 의견을 바탕으로, 여기에 몇 가지 다른 패턴은 당신이 시도 할 수 있습니다 :
s = Regex.Replace(s, @"[^\u0020-\u007F]", "");
이 숫자를 제외한 모든 것을 제거
모든 비 ASCII 문자와 ASCII 제어 문자를 제거 ASCII 문자 :
ASCII가 아닌 문자를 대체 한 후 XML을 쓰려고하면 "16 진수 값 0x05는 유효하지 않은 문자입니다" – Novice
@Novice'0x05'는 ASCII 제어 문자입니다. 그것도 제거하고 싶다면, 내 대답에 게시 된 것 대신에 이것을 사용할 수 있습니다 :'s = Regex.Replace (s, @ "[^ \ u0020- \ u007F]", "");'. 어디에서 당신의 의견을 받고 있습니까? – Donut
mysql 데이터베이스에서 입력을 받고 있습니다. 테이블의 필드 문자 집합이 "utf_8" – Novice
유니 코드 블록 이름도 사용할 수 있습니다.
source = Regex.Replace(source , @"\p{name}", "");
이름 목록은 this article.에서 찾을 수 있습니다. 귀하의 캐릭터가 어떤 블록에 속할지 확실하지 않습니다.
- 1. Java 문자열에서 \ F \ 바꾸기
- 2. 문자열에서 기호 찾기 Java
- 3. vb.net에서 더하기 기호 "+"바꾸기
- 4. 문자열에서 문자 바꾸기
- 5. Objective-C의 문자열에서 문자 삭제
- 6. Objective-C의 문자열에서 공백을 제거하십시오.
- 7. 문자열에서 중복 된 기호 제거
- 8. Objective-C의 문자열에서 속성/인스턴스 변수 호출
- 9. 왜 GenTLB 기호 이름 바꾸기 ('_'추가)
- 10. 표에서 이상한 기호 찾기 및 바꾸기
- 11. Powershell 문자열에서 경로 바꾸기 내 스크립트에서
- 12. .NET 문자열에서 Oracle 줄 바꿈 문자 바꾸기
- 13. 기호, PHP
- 14. C의 비트 문자열에서 0의 수를 계산하는 함수를 만들기위한 아이디어?
- 15. Ruby : MS Word에서 붙여 넣은 글 머리 기호 바꾸기
- 16. 문자열에서 @를 %로 바꾸기 (일괄 스크립팅 만 사용)
- 17. T-SQL을 사용하는 MS SQL의 긴 문자열에서 특정 패턴 바꾸기
- 18. 통화 기호 기호 개요?
- 19. 문자열 바꾸기 (PHP)
- 20. 기호
- 21. 찾기 자리 내 문자열에서
- 22. 문자열에서
- 23. java : "with \"로 바꾸기
- 24. C에서 문자열에서 문자를 제거
- 25. 클래스를 변수로 바꾸기
- 26. 문자열에서 숫자를 제거 하시겠습니까? 문자열에서
- 27. @ 기호는 Objective-C의 의미는 무엇입니까?
- 28. VBA에서 변수 문자열 바꾸기
- 29. PHP dom 바꾸기
- 30. C의 문자열 배열을 선언하는 방법
처음에 어떻게 그런 상징을 얻었습니까? 인코딩을 포기한 것처럼 보입니다. 교체는 해결책이 아닙니다. 문제의 뿌리를 다루십시오.이 문자열을 얻는 방법을 고치고 죽은 것을 소생 시키려고하지 마십시오. –
[인코딩/코드 페이지 문제] (http://www.joelonsoftware.com/articles/Unicode.html)와 유사합니다. –
영숫자와 구두점을 제외한 모든 것을 제거하려고합니까? –