2010-03-03 3 views

답변

4

그것은이다 아마 공백 즉 공백 탭 또는 문자열을 시도 : -

attrs[attr].strip() 
+1

공백 grrr – KacieHouser

+0

너무 감사합니다. 스트립 기능을 제공하는 것을 보지 못했습니다. – KacieHouser

3

은 아마도이 공백을 포함하고 있습니다. 당신은 "\의 t"

변경 당신은 (거의) 항상위한 것입니다 텍스트 문자열에 공백을 정상화 if attrs[attr] is not None and attrs[attr].strip() !="":

+0

공백을 제거하는 함수를 찾는 것에 대해 생각해 보았습니다. 그러나 공백 만 제외하고는 줄무늬를 원하지 않았습니다.하지만 이는 의미가 있습니다. – KacieHouser

+1

스트립은 문자열 멤버 함수입니다. 그렇지 않습니까? 그래서 attrs [attr]이 None이 아니고 attrs [attr] .strip()! = "": –

+0

@craig : 잡아 주셔서 고마워요. 고쳐 주셨으면합니다. –

1

에 코드에 그것을 라운드 시세 및 쇼 탭을 넣을 것이다 repr(attrs[attr])을 인쇄하여이를 확인할 수있다 삽입 (또는 많은 다른 목적을 위해).

공백을 정규화하려면 (1) 공백을 제거하고 (2) 공백의 내부 실행 (길이> = 1)을 정확히 1 SPACE (U + 0020)로 바꾸십시오.

공백은 Python 2.X에서 작업하고 유니 코드 객체를 사용하지 않는 경우 특히 Python 표준이 제공하는 것에 국한되어서는 안됩니다. 예를 들어, 기본 "C"로켈에서 "\ xA0"은 공백으로 처리되지 않지만 NO-BREAK SPACE (U + 00A0)를 나타낼 가능성이 큽니다. 파이썬 2.X에 대한

샘플 코드 :

def normalize_white_space_u(unicode_object): 
    return u' '.join(unicode_object.split()) 

def normalize_white_space_s(str_object): 
    return ' '.join(str_object.replace('\xA0', ' ').split()) 

두 번째 기능을 일반화 : 하나의 공간에 의해 표준이 아닌 공백 문자의 각 항목을 바꾸 다음 분할에 가입 춤을.

관련 문제