PHP 정규식 엔진을 테스트 한 결과 [0-9A-Za-z_]
만 단어로 간주됩니다. 히브리어와 같은 비 ASCII 언어의 문자는 [\w]
이라는 단어 문자와 일치하지 않습니다. 모든 언어의 문자와 일치하는 PHP 또는 Perl 정규식 이스케이프 시퀀스가 있습니까? 내가 사용하기를 기대하는 각 알파벳의 범위를 추가 할 수 있지만, 사용자는 예기치 않은 언어로 항상 우리를 놀라게 할 것입니다!모든 언어의 단어 문자에 대한 Regex
보안 필터링이 아니라 텍스트 토큰 화에주의하십시오.
아주 좋습니다. 감사합니다. 또한 작동시키기 위해서'u' 수정자를 추가해야했습니다. – dotancohen