파이썬과 팬더 (첫 번째와 두 번째 모두)에서 첫 번째 분석을 설정하고이를 올바르게 설정하는 방법에 대해 몇 가지 질문을합니다.팬더의 DataFrame에서 이전 열 참조/계산하기
본질적으로 사용자 행동을 시계열로 살펴보기 위해 노력하고 있지만, 나는 일보다 많은 사용자가 있으므로 매월 보려고합니다. 나는 DataFrame
이런 식으로 구축 한 :
df2 = pd.DataFrame({'ID':range(100)})
df2['Day1'] = random.sample(xrange(1000), 100)
df2['Day2'] = random.sample(xrange(1000), 100)
df2['Day3'] = random.sample(xrange(1000), 100)
나는 'ID'열 여러 가지 방법으로 인덱스를 추가하려고했습니다,하지만 1) 내가 필요 확실하지 않고 내 방법 중 2) 어느 것 갖다.
df2 = pd.DataFrame({'ID':range(100)}, index_col='ID')
df2 = pd.DataFrame({'ID':range(100)}, index_col=0)
df2.index(0)
df2.index('ID')
df2.reindex(index='ID')
df2.reindex(index=0)
나는 둘째 날의 값이 1 일 95 % 이상 작은 지 여부를 표시하는 새로운 dataframe를 만들려고하고있는 무슨의 최종 출력은, 3 일이 95 %인지 : 여기에 내가 시도 것입니다 2 일째 이후 - 앞으로 (100 열 중 DataFrame
을 가졌다 고 상상해보십시오). 내가 볼 것 출력은 다음과 같습니다
ID Day2 Day3
1 NaN 1
2 NaN NaN
3 NaN NaN
4 1 NaN
나는이 결정하는 적절한 방법은 이런 식으로 루프를 실행 믿는다
for i in df2:
if (Day2-Day1)/Day1 < .95:
print 1
을 그러나, 나는이 방법을 잘 모르겠어요 내 함수에서 열을 참조하거나이 함수를 유연하게 만들어 모든 열을 DataFrame
에 포함시킬 수는 없습니다. 이 함수의 열을 어떻게 참조해야합니까?
이 기능의 열을 어떻게 참조해야합니까?