2009-10-25 15 views
2

Ruby에서 문자열 을 유니 코드 범위으로 분할하는 방법은 무엇입니까? \ u1000에서 \ u1000을 (를) 쉼표로 구분하고 싶었습니다. 예를 들어, 나는 ...Ruby로 유니 코드 문자열 분할

을이 문자열을 분할 싶어 나는 사랑 ျ이에 မန္ မာ

... 내가 မန္ မာ

, ျ 당신은 할 수있다 사랑

내 예제에서는 유니 코드 문자를 볼 수 없습니다. 유니 코드 범위는 \ u1000 이상입니다.

감사합니다.

답변

2

사용중인 버전에 따라 다릅니다. 여기에 1.9에 대한 해결책이 있습니다. 나는 1.8이 추악해질 수 있다고 상상한다.

이것은 우아함에 떨어지지 만 작동하는 것 같습니다.

"I love ျမန္မာ".gsub(/([\u0000-\u0999])([\u1000-\u9999])/, '\1,\2') 

이 방법이 적합한 경우 (낮은 전환 높은) 다른 케이스를 제공해야합니다

관련 문제