2016-09-04 3 views
0

그래서 저는 현재 모든 단어를 일치시키는 특수 문자 (파이썬에서)를 만들었지 만 특수 문자는 무시합니다.스웨덴어 단어가 아닌 숫자와 일치하는 정규식

그러나 숫자도 일치합니다. 숫자와 일치하지 않게하려면 어떻게해야합니까?

+3

TIP 될 것입니다 : ** \ w ** 플래그가 동일합니다 [A-ZA는-z0-9_] –

+0

정규 표현식은 혼자이 적합하지 않습니다 일반적인 경우의 작업. 여기서 해결 방법은 여전히 ​​실패합니다. * TV 프로그램 * 또는 * idé * 더 일반적으로 일치하는 단편이 URL, 이메일 주소 또는 실제로 한 단어의 일부인지 여부를 알 수 없습니다. 언어 학적 분석을위한 시스템은 언어 별 토크 나이저를 사용하지만 실제, 라이브, 인간 자유형 산문에서 100 % 미만을 유지합니다. – tripleee

답변

3

\w 문자 클래스는 [A-Za-z0-9_]과 같습니다.

그래서 어쩌면 :

[åäöÅÄÖA-Za-z_]+ 

이 더 나은 선택

+0

\ w에 대해 알지 못했습니다! 고맙습니다. – osk

+1

'\ w'는 "플래그"가 아니지만 문맥에 따라 문자 클래스와 내용이 바뀝니다 (유니 코드 또는 아님). 기본적으로 파이썬 2.7에서는'[A-Za-z0-9_]'만이 포함되어 있지만 유니 코드 플래그 ('re.U') 또는 파이썬 3에서는 기본적으로 다른 알파벳의 악센트 부호가있는 문자, 문자 및 숫자가 포함되어 있습니다 . –

관련 문제