2012-09-27 2 views
7

PHP 정규식 엔진을 테스트 한 결과 [0-9A-Za-z_] 만 단어로 간주됩니다. 히브리어와 같은 비 ASCII 언어의 문자는 [\w]이라는 단어 문자와 일치하지 않습니다. 모든 언어의 문자와 일치하는 PHP 또는 Perl 정규식 이스케이프 시퀀스가 ​​있습니까? 내가 사용하기를 기대하는 각 알파벳의 범위를 추가 할 수 있지만, 사용자는 예기치 않은 언어로 항상 우리를 놀라게 할 것입니다!모든 언어의 단어 문자에 대한 Regex

보안 필터링이 아니라 텍스트 토큰 화에주의하십시오.

답변

1

에서 참조를 참조하십시오. 어떤 언어의 모든 문자와도 일치합니다. 문자 세트 []을 사용하고 싶지 않은 경우.

관련 문제