파이썬에서 히스토그램의 시계열을 플로팅하려고합니다. There has been a similar question about this, but in R. 그래서, 기본적으로, 나는 똑같은 것을 필요로합니다.하지만 저는 R에서 정말 나쁩니다. 데이터 세트에 하루에 보통 48 개의 값이 있습니다. 여기서 - 9999는 누락 된 데이터를 나타냅니다. Here's 데이터 샘플.파이썬에서 히스토그램의 시간 그래프를 플롯
데이터를 읽고부터 시작하여 pandas
DataFrame
으로 시작했습니다.
import pandas as pd
df = pd.read_csv('sample.csv', parse_dates=True, index_col=0, na_values='-9999')
print df
<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 336 entries, 2008-07-25 14:00:00 to 2008-08-01 13:30:00
Data columns (total 1 columns):
159.487691046 330 non-null values
dtypes: float64(1)
는 지금은 그룹 일까지 데이터 수 :
daily = df.groupby(lambda x: x.date())
을하지만 그때 붙어있어. 나는 이것을 히스토그램의 timeseries를 얻기 위해 matplotlib
과 함께 사용하는 방법을 모른다. 어떤 도움을 주셔서 감사합니다. 반드시 pandas
을 사용할 필요는 없습니다.
요리 책에 추가하십시오! – Jeff
감사! 이렇게해야합니다. 저는 9999가 빠진 숫자이므로 폐기해야한다는 것을 완전히 잊어 버렸습니다. 질문에 추가 할 것입니다. – abudis
이것은 매우 멋지다! –