2011-04-19 4 views
1

"a"위의 분음 기호는 Regex에 의해 제거되지 않아야합니까?Ruby 1.9 regexp를 얻는 방법 p {Nonspacing_Mark}을 지원합니까?

"hǎo".gsub(/\p{Nonspacing_Mark}/, '') 
=> "hǎo" 

"hǎo".gsub(/\p{Mn}/, '') 
=> "hǎo" 

업데이트 :

내가 가지가 자바에서 작동하는 방법에서 그것을 얻을.

Normalizer.normalize("hǎo", Form.NFD).replaceAll("\\p{Mn}+", "") 

"ǎ"을 "a"와 분음 기호로 분리하려면 먼저 정규화해야합니다.

+0

을 살펴보기이 http://stackoverflow.com/questions/3571480/converting-chinese-to-pinyin – abi1964

+0

루비 소스 코드가 UTF-8에 알고 있나요? – tchrist

+0

"악센트를 구분하지 않는"방식으로 두 문자열을 비교하는 방법을 모르기 때문에이 사악함을 원하십니까? – tchrist

답변

관련 문제