2012-04-06 2 views
1

정규 표현식에 관해 도움이 필요합니다.스웨덴어 문자 패턴 일치

\ S * A-ZA-Z] + [A-ZA-Z_0-9 * \ I 사용한 패턴

âãa34dc :

은이 같은 문자열과 일치해야 s

하지만이 패턴은이 종류의 문자열을 식별하는 데는 충분하지 않습니다. âaa34dc

P. 이것은 스웨덴 문자입니다.

이 유형의 문자열에 올바른 패턴을 찾으려면 도와주세요.

+0

기존 답변의 유효성을 변경하지 않는 사소한 수정 : "â"와 "â"는 외국어 또는 철자법을 제외하고 스웨덴어로 사용되지 않습니다. OP가 원하는 것은 아마 "åäö/ÅÄÖ"입니다. – allansson

답변

0

일련의 규칙을 알려주십시오. 귀하의 질문에 따라

:

[X-Ya-zA-Z]{3}[0-9]{2}[a-zA-Z]{2} 

마지막 스웨덴어 편지

+0

규칙은 영어 알파벳과 같습니다.이름은 스웨덴 문자로 시작하거나 영어 알파벳으로 시작할 수 있습니다. 그래서 나는 위에서 쓴 것처럼 나의 모든 조건에 부합하는 후각을 원한다. 시간 내 주셔서 감사 드리며 불분명하지 않은 질문에 대해 미안합니다. – user1213444

0

John Machin와 Y를 교체 첫 스웨덴어 문자로 X를 교체 이것에 대한 좋은 해답을 제공합니다. 패턴을 수정하면 아마도 다음과 비슷한 것이 될 것입니다. \s*[^\W\d_]\w*\s*

P. 첫 번째 부분에서 + 수량 한정 기호를 제거했습니다. 모든 후속 문자는 후속으로 정량화 된 \w으로 매칭됩니다.

+0

규칙은 영어 알파벳과 같습니다. 이름은 스웨덴 문자로 시작하거나 영어 알파벳으로 시작할 수 있으며 숫자와 밑줄도 포함될 수 있습니다. 그래서 나는 위에서 쓴 것처럼 나의 모든 조건에 부합하는 후각을 원한다. 당신의 대답은 내 문제를 해결하는데 전혀 도움이되지 않습니다. – user1213444

+1

아니요, '\ w'는'[A-Za-z0-9_]'와 다릅니다. 유니 코드 인식 환경 (예 : .NET)에서 '\ w'는 알파벳 (스웨덴어 포함)의 문자와 일치합니다. 너는 내 패턴을 시험해 보는 것을 실제로 괴롭 혔습니까? – Douglas

3

실제로 스웨덴 문자로 제한 하시겠습니까? 다시 말해서, 독일어 문자가 일치하지 않아야합니까? 그렇다면 전체 알파벳을 열거하고이를 포함시켜야 할 것입니다.

알파벳 문자를 모두 일치 시키려면 모든 문자를 일치시키는 정규식 용어를 사용하십시오.

\w은 모든 단어 문자와 일치하지만 숫자에는 & 일부 구두점이 포함됩니다. 그것은 거의 비슷하지만 두 번째 임기를 원하는 것이 아닙니다.

숫자를 포함하고 싶지 않은 첫 번째 기간에는 문자가 유니 코드 '문자'클래스 여야한다고 지정하면됩니다. \p{L}은 문자 인 모든 유니 코드 문자를 지정합니다.

\s*[\p{L}][\p{L}_0-9]*\s

경우 :이

따라서, 나는이 정규 표현식 생각 등 당신이 원하는 [A-Za-z]와, 모든 스웨덴 문자, 독일어, 러시아어를 포함 digits from other character sets 및 일부 other punctuation을 포함하려면 두 번째 용어로 [\w]*을 사용할 수 있습니다.