내 Java 응용 프로그램으로 탭으로 구분 된 텍스트 파일 (Excel에서 내 보낸 파일)을 읽었지만 원하지 않는 잘못된 문자가 파일에 포함되어있을 수 있습니다. 이러한 문자가 표시 예를 들어, 스프레드 시트에서 내가 본 (I 스프레드 시트를 생성하지 않음) : 탭으로 쇼를 구분 유효하지 않은 문자 감지
�
는 :
�
이 분명히 유니 코드 문자입니다 '교체 문자'. 가져 오기를 중단 할 수 있도록 Java 문자열에서이 문자를 어떻게 검색합니까?
String invalidString = "1234 � test2"
"유효한"문자로 생각되는 부분은 무엇입니까? –
아스키 값을 확인할 수 있습니다 –
@LoganMurphy : Ascii? 당신은 UTF-8 코드 포인트를 의미합니까? – tilpner