1
"a"위의 분음 기호는 Regex에 의해 제거되지 않아야합니까?Ruby 1.9 regexp를 얻는 방법 p {Nonspacing_Mark}을 지원합니까?
"hǎo".gsub(/\p{Nonspacing_Mark}/, '')
=> "hǎo"
"hǎo".gsub(/\p{Mn}/, '')
=> "hǎo"
업데이트 :
내가 가지가 자바에서 작동하는 방법에서 그것을 얻을.
Normalizer.normalize("hǎo", Form.NFD).replaceAll("\\p{Mn}+", "")
"ǎ"을 "a"와 분음 기호로 분리하려면 먼저 정규화해야합니다.
을 살펴보기이 http://stackoverflow.com/questions/3571480/converting-chinese-to-pinyin – abi1964
루비 소스 코드가 UTF-8에 알고 있나요? – tchrist
"악센트를 구분하지 않는"방식으로 두 문자열을 비교하는 방법을 모르기 때문에이 사악함을 원하십니까? – tchrist