2010-02-01 6 views
1

자바 스크립트에서 단어에 split(/\W+/) 정규식을 사용하고 있습니다. 자바 스크립트 정규식 유니 코드 도움말

내가이 분할

, 그것은

var s3 = "bardzo dziękuję"; 
s3 = s3.split(/\W+/); 


[0]: "bardzo" 
[1]: "dzi" 
[2]: "kuj" 

어떻게이 문제를 해결하기 위해 잘못된 값을 반환하는거야? 조언을 부탁하십시오

답변

1

정규식은 단어가 아닌 문자로 악센트 문자를 취급하고 있기 때문에 분할하지 않습니다.

를 사용하여 공백 특수 문자 : - 당신은 완전히 유니 코드를 처리 CharFunk https://raw.github.com/joelarson4/CharFunk을 사용할 수

s3 = s3.split(/\s+/); 
+0

감사합니다. – kakopappa

1

공백으로 분할하지 않는 이유는 무엇입니까?

s3.split(/\s+/);

1

.

var s3 = "bardzo dziękuję"; 

function notLetterOrDigit(ch) { 
    return !CharFunk.isLetterOrDigit(ch); 
} 

CharFunk.splitOnMatches(s3, notLetterOrDigit);