2013-07-05 4 views
2

파이썬 스크립트를 사용하여 많은 .csv 파일을 정리하고 연결합니다. 특히, 나는 pandas read_csv 함수를 사용하여 파일을 읽은 다음 이들을 데이터 프레임 객체로 처리합니다.이 객체는 훌륭하게 작동했습니다. 이것은 팬더를 사용한 첫 번째 시간이기 때문에 여전히 포함 된 모든 유용한 기능에 익숙해 져 있습니다.팬더 데이터 프레임의 모든 값을 NA로 바꾸는 빠른 방법

내가 읽고있는 csv 파일은 -99.9를 NA/NaN을 나타내는 센티넬 값으로 사용합니다. 이것은 다른 곳에서 누락 된 데이터를 나타내는 방식과 다르므로, -99.9의 모든 발생을 "NaN"으로 변경하고 싶습니다. 이를위한 빠른 방법이 있습니까? 아니면 데이터 프레임을 반복하고 각 값을 확인해야합니까?

답변

1

윱의 응답이 더 우아 @ 내 생각을 확인합니다. 당신은 CSV에서 읽은 후, NA/NaN 교체해야합니다 기타 특정 값이있는 것을 발견한다면, 당신은 사용할 수 있습니다 False에 올바른 위치 설정

pandas_dataframe.replace(['bad_data_1', 'bad_data_2'], [None, None], inplace=True) 

을 별도의 dataframe을 만들려면.

과 같은 목록을 포함 윱의 응답 @ 수정 다음은 CSV를 읽는 동안 당신은 나쁜 값을 알고있는 경우 : 내가 찾던 그냥 어떤

train_df = pd.read_csv('/my.csv', na_values=["bad_value_1", "bad_value_2"]) 
관련 문제