2017-09-22 1 views
0

큰 데이터 프레임이 있습니다. 열을 자동으로 제거하고 싶습니다. (열 키/이름은 동적이므로 원칙적으로 열 번호와 이름을 모릅니다.)에 전체 행 번호의 일정 비율 미만의 0이 아닌 요소가 있습니다.0이 아닌 백분율로 열을 선택하십시오.

감사합니다.

+1

샘플 데이터가 도움이 될 것입니다. – Dark

답변

0

팬더에는 dropna 함수가 있으며, 이는 thresh 매개 변수입니다. 유지할 필요가있는 0이 아닌 값의 수로 설정하기 만하면됩니다. 따라서

df.dropna(thres=int(len(df)*0.8), axis=1) 

행의 80 % 미만이 완료된 열을 삭제합니다.

+0

고맙습니다.이 0을 Nan으로 변환하면 작동합니다. df.replace (to_replace = 0, value = np.nan) 및 df.dropna (thres = int (len (df) * 0.8), 축 = 1) – user3620915