팬더 데이터 프레임의 모든 값을 NA로 바꾸는 빠른 방법

파이썬 스크립트를 사용하여 많은 .csv 파일을 정리하고 연결합니다. 특히, 나는 pandas read_csv 함수를 사용하여 파일을 읽은 다음 이들을 데이터 프레임 객체로 처리합니다.이 객체는 훌륭하게 작동했습니다. 이것은 팬더를 사용한 첫 번째 시간이기 때문에 여전히 포함 된 모든 유용한 기능에 익숙해 져 있습니다.팬더 데이터 프레임의 모든 값을 NA로 바꾸는 빠른 방법

내가 읽고있는 csv 파일은 -99.9를 NA/NaN을 나타내는 센티넬 값으로 사용합니다. 이것은 다른 곳에서 누락 된 데이터를 나타내는 방식과 다르므로, -99.9의 모든 발생을 "NaN"으로 변경하고 싶습니다. 이를위한 빠른 방법이 있습니까? 아니면 데이터 프레임을 반복하고 각 값을 확인해야합니까?

출처

2013-07-05 seaotternerd

read_csv 메서드를 사용할 때 그렇게 할 수 있습니다. 매개 변수를 추가하여 read_csv 메소드의 매개 변수로

na_values=-99.9

을 추가하십시오. 전체 문서

http://pandas.pydata.org/pandas-docs/stable/generated/pandas.io.parsers.read_csv.html

출처

2013-07-05 05:30:07 Joop

합니다. 감사! 내가해야하는 유일한 변화는 -99.9를 문자열로 만들어 목록에 넣는 것입니다 (즉, "-99.9"). – seaotternerd

윱의 응답이 더 우아 @ 내 생각을 확인합니다. 당신은 CSV에서 읽은 후, NA/NaN 교체해야합니다 기타 특정 값이있는 것을 발견한다면, 당신은 사용할 수 있습니다 False에 올바른 위치 설정

pandas_dataframe.replace(['bad_data_1', 'bad_data_2'], [None, None], inplace=True)

을 별도의 dataframe을 만들려면.

과 같은 목록을 포함 윱의 응답 @ 수정 다음은 CSV를 읽는 동안 당신은 나쁜 값을 알고있는 경우 : 내가 찾던 그냥 어떤

train_df = pd.read_csv('/my.csv', na_values=["bad_value_1", "bad_value_2"])

출처

2015-09-13 01:12:27 Kingz

팬더 데이터 프레임의 모든 값을 NA로 바꾸는 빠른 방법

답변

관련 문제