타사 API/웹 서비스를 다루고 있으며 해당 XML에 latin-1 문자 집합 만 허용합니다. 문자열에있는 모든 비 라틴 -1 문자를 찾아서 바꿀 수있는 기존 API/메소드가 있습니까?API 또는 모든 비 라틴 -1 문자를 바꾸는 방법
예 : 케빈
어쨌든 케빈을 만들 수 있습니까? 내가 자바 1.6 필요한 정규화가 될 수 내장에서 http://glaforge.appspot.com/article/how-to-remove-accents-from-a-string
에서이 예제를 발견
public String removeAccents(String text) {
return Normalizer.decompose(text, false, 0)
.replaceAll("\\p{InCombiningDiacriticalMarks}+", "");
}
ICU4J를 사용
무엇으로 바꾸시겠습니까? – bmargulies
@bmargulies 내 질문을 업데이트했습니다. – Gregg
'K é vin'을 사용하지 않으려면 (간단한 텍스트 편집기에서 열 때) 바이트 스트림에서 제거하려면, 실제로는 XMl 인포 셋에서 제거하십시오 XML 파서가 응용 프로그램으로 읽습니다.) – MvG