2012-06-13 6 views
1

공백과 마침표를 모두 허용하는 정규식을 사용하여 파이썬 스크래퍼를 작성하려고합니다.공백과 마침표를 허용하는 파이썬 스크래퍼 정규식

특정 사이트에서 야구 팀 이름을 얻으려고하는데, 일부는 Miami (전체 단어)이지만 다른 사람은 San Francisco (공백 포함)이고 다른 사람은 Chi. Cubs (마침표 및 공백)입니다.

도시 이름 앞의 패턴을 알고 패턴 이름을 알고 있습니다. 나는 charecters 또는 공백이나 마침표의 수에 관계없이 모든 것을 일치시키는 것을 찾으려고합니다. 정규 표현식을 사용하는 것을 선호하지만, 다른 라이브러리를 사용하기가 더 쉽다면 그 라이브러리를 열어 볼 수 있습니다.

[ .a-zA-Z]+ 

예 : 당신은, 즉`\ .`으로 지금 기간을 탈출 할 필요가

>>> re.search(r'[ .a-zA-Z]+', 'Miami').group(0) 
'Miami' 
>>> re.search(r'[ .a-zA-Z]+', 'San Francisco').group(0) 
'San Francisco' 
>>> re.search(r'[ .a-zA-Z]+', 'Chi. Cubs').group(0) 
'Chi. Cubs' 

답변

2

공백 기간, 또는 문자의 수와 일치하는 정규식 그것은 모든 문자와 일치합니다.
+1

다음 – Junuxx

+0

@Junuxx -'.'는 문자 클래스 내에서 특별한 의미가 없기 때문에 이스케이프 처리는이 정규식에서 필요하지 않습니다. –

+0

아, 맞아, 몰랐어. – Junuxx