나는 perl을 사용하고 움라우트 등의 악센트 부호가있는 문자열을 식별해야합니다. 정규 표현식 [A-z]을 사용하려고했으나 제대로 작동하지 않았습니다. 내가 사용하는 펄 코드는 다음과 같습니다perl의 악센트 부호가있는 문자 식별
if ($s =~ /[^\P{Latin}A-Za-z]/) {
# accented chars, do something
} else {
# No accented chars, do something else
}
\p{Latin}
가 (악센트 문자와 ç œ æ...
같은 문자를 포함하여) 라틴어 문자를 포함
if ($s =~ /^[A-za-z0-9_]+$/) {
# No accented chars, do something
} else {
accented chars, do something else
}
[this] (http://perldoc.perl.org/perlre.html#Regular-Expressions) 체크하고 싶을 것입니다. . 희망이 도움이됩니다! – Cullub
로케일에 따라 다르다고 생각하지만 확장 된 범위에있는 모든 것이 악센트 부호가있는 문자이면'[\ x80- \ FF] +'를 사용할 수 있습니다. – sln