2016-08-30 3 views
0

데이터가 쉼표로 구분되어 저장되는 1000 개의 파일이 있습니다. 파일의 설명은 아래에 주어진다 :팬더에서 CSV 파일 읽기 및 플로팅

값은 쉼표로 구분되는 -9999 값은 무시되어야하며,이를 판독 할 수있는 경우가 갖는 한 는 행과 열의 모든 값은 숫자 저장되어야 플로팅에 사용됩니다. 파일의 모양은 [104 행 x 15 columns]입니다.

0, 9.8597e+00, 129.944, 1.071, 6.7433e-06, 1.0911e-05,  -9999,  -9999, 3.7134e-07, 3.5245e-05,  -9999,  -9999, 26.295, -86.822, -123.017 



0, 8.7012e+00, 130.908, 0.966, 1.9842e-06, 1.0799e-05,  -9999,  -9999, 3.5888e-07, 7.8133e-05,  -9999,  -9999, 27.140, -86.818, -122.322 

숫자 값으로 읽은 후, 나는 또한 부가 적 줄거리로 플롯 할 필요가 다음과 같이

파일의 몇 줄 수 있습니다. COl1 대 Col2, Col3 대 col5 등등 ....

어떻게 구현할 수 있습니까?

import numpy as np 
import pandas as pd 
import matplotlib.pyplot as plt 

df1=pd.read_csv("small_file_106.txt",header=1) 
print(df1) 

답변

1

나는 음모를 사용하지 않지만 na_values에 값 목록 첫 번째 질문 입력 유용 할 것이다 다음과 사람들은

pd.read_csv(File, sep=',',na_values=['-9999'],keep_default_na=False) 

또한 pd.to_numeric 사용할 수 있습니다 팬더에 의해 NA로 간주하게 될 것이다 당신이 (시조의 방법은 좋은 모양) Seaborn library's pairplot 쉬에서 데이터를 읽을하면 숫자

df.apply(lambda x: pd.to_numeric(x, errors='ignore')) 
0

로 데이터를 변환 ould는 원하는 줄거리를 생성합니다.

+0

감사합니다. 지금 대부분의 경우 작동합니다! – MPJ