2017-02-08 4 views
1

데이터 프레임의 열 값을 보면 사용자 데이터 입력 오류로 인해 동일한 카테고리가 잘못 입력 된 것을 볼 수 있습니다. 내 dataframe를 들어Python pandas가 열의 값을 바꿉니다.

이 코드를 사용

df['column_name'].value_counts() 

출력 : 이야기를 들어

Targeted 523534 
targeted 1 
story  25425 
story  2 
multiple 2524543 

, 나는 공간이 됐을까?

타겟으로 교체하려고합니다.

df['column_name'].replace("targeted","Targeted") 

하지만 아무런 변화가 없지만 여전히 동일한 값을 얻습니다.

+0

는 [ 'COLUMN_NAME''당신에게 DF나요 :

df['column_name'] = df['column_name'].str.strip().replace("targeted","Targeted") 

df['column_name'] = df['column_name'].str.strip().str.replace("targeted","Targeted") 

또 다른 가능한 해결책은 모든 문자를 소문자로 변환입니다 ] .replace ("targeted", "Targeted"). value_counts()'? – Zero

답변

1

네, 시작 공백이있는 것 같습니다.

필요 str.strip 먼저 다음 Series.replace 또는 Series.str.replace는 :

df['column_name'] = df['column_name'].str.strip().str.lower() 
+0

감사합니다,이 옵션은 최상의 df [ 'column_name'] = df [ 'column_name'] .str.strip(). replace ("targeted", "Targeted") – jeangelj

관련 문제