문자열에서 UTF-8이 아닌 문자를 모두 제거하는 기능이 있습니까?비 UTF-8 문자 제거 또는 인코딩
2
A
답변
10
잘못된 문자가 포함될 수있는 UTF-8 문자열이있는 경우 iconv
을 사용하여 해당 문자를 제거 할 수 있습니다. 이 작업을해야합니다 : 임의의 자리로 표시 만들기
$text = iconv("utf-8", "utf-8//ignore", $text);
은 약간 험악하다 - 나는 모든 바이트를 걷는 짧은, 그렇게 할 수있는 쉬운 방법을 생각하고 유효한 문자인지 볼 수 없습니다. Wikipedia article은이를 수행하는 방법에 대한 자세한 정보를 제공합니다.
관련 문제
- 1. 비 UTF8 문자 대체
- 2. Nginx : utf8 문자 인코딩 정적 파일
- 3. 비 ASCII 문자 제거
- 4. 곡예사 PDF - XFDF 데이터 문자 UTF8 인코딩
- 5. Base64 및 utf8/National 문자 인코딩
- 6. Nokogiri - 인코딩 문제 - 잘못된 UTF8 문자
- 7. UTF8 인코딩?
- 8. Java UTF8 인코딩
- 9. UTF8 및 일본어 문자
- 10. 레일 UTF8 인코딩 문제
- 11. UTF8 인코딩 문제
- 12. utf8 인코딩 오류 감지
- 13. knitr 및 UTF8 인코딩
- 14. utf8 및 인코딩
- 15. C# UTF8 인코딩
- 16. php utf8 인코딩
- 17. WPF WebBrowser NavigateToString 대 NavigateToStream (히브리어/비 utf8 인코딩)
- 18. utf8 문자열의 latin1 문자 감지
- 19. MYSQL에 utf8 문자 가져 오기
- 20. 문자 인코딩 "UTF8"의 0xe28093는 "LATIN1"에 상응이없는
- 21. PHP (아마도 UTF8) 인코딩/디코딩 문제 - 표시하는 단일 문자
- 22. JavaScript로 HTML 문자 또는 다른 문자 제거
- 23. PostgreSQL utf8 문자 비교
- 24. QLPreviewController 및 UTF8 문자
- 25. UTF8 그것이 내가 UTF8 인코딩 이상한 동작을 실제 장치
- 26. 템플릿 툴킷 문자 인코딩
- 27. 변수에서 문자열 또는 문자 제거
- 28. primefaces utf8 문자 필터로 파일 업로드
- 29. File.Copy 및 문자 인코딩
- 30. 스페인어 문자 인코딩 - iphone
Yur 질문은 몹시 불투명합니다. 문자열이 유니 코드이면 해당 문자열에 포함 된 모든 문자는 정의상 유니 코드 문자입니다. –
@Michael은 UTF-8의 경우 사실이 아닙니다. http://en.wikipedia.org/wiki/UTF-8#Invalid_byte_sequences –
@Pekka, 그렇다면 유니 코드 문자열이 아닙니다. 비록 내가 오해하고있을 수도 있지만, OP는 유니 코드 문자열을 가지고 있지 않습니다. –