2017-03-21 1 views
-3

저는 파이썬 판다 프로그래밍에 익숙하며 크로스 테이블에 대해 더 많은 것을 탐구하려고합니다. 여러 변수에 대한 교차 테이블을 생성해야하지만 하나의 상수 변수가 필요한 요구 사항이 있습니다. 즉 여러 변수와 최상위 변수로 나타납니다.파이썬에서 데이터 프레임으로 크로스 테이블 생성

웹에서 내 요구 사항을 검색했지만 2 개 또는 3 개의 변수 중 교차 표만 찾을 수있었습니다.

내 요구 사항에오고 난 지금이 ​​dataframe 내에서 변수 중 하나를 사용하여 dataframe (DF)를 표로 통과하려는 dataframe

`df = pd.read_csv('C:\Users\Desktop\data.csv')` 

로 읽고있다 data.csv 파일에 데이터 집합을 가지고있다. Cross table Image

처럼

... pd.crosstab(df, df.age, margins=True)

예, 그래서 사람이 문제 해결에 도움이 될 수. 많은 피드백에 감사드립니다.

+2

에 오신 것을 환영합니다. 이 게시물을 읽으려면 [훌륭한 팬더 예제를 제공하는 방법] (http://stackoverflow.com/questions/20109391/how-to-make-good-reproducible-pandas-examples) 및 [최소한의 완전하고 검증 가능한 예제] (http://stackoverflow.com/help/mcve)를 제공하고 이에 따라 질문을 수정하십시오. 좋은 질문을하는 방법에 대한 팁 (http://stackoverflow.com/help/how-to-ask)도 유용 할 수 있습니다. – jezrael

답변

0

pd.pivot_table()을 알고 계십니까?

In [139]: df 
Out[139]: 
     a b c d 
0 5.1 3.5 1.4 0.2 
1 4.9 3.0 1.4 0.2 
2 4.7 3.2 1.3 0.2 
3 4.6 3.1 1.5 0.2 
4 5.0 3.6 1.4 0.2 

다음에 StackOverflow에

In [138]: pd.pivot_table(df, index=['a','b','c']) 
Out[138]: 
       d 
a b c  
4.3 3.0 1.1 0.1 
4.4 2.9 1.4 0.2 
    3.0 1.3 0.2 
    3.2 1.3 0.2 
4.5 2.3 1.3 0.3 
4.6 3.1 1.5 0.2 
    3.2 1.4 0.2 
    3.4 1.4 0.3 
+0

테이블이 있어야하는 방법을 보여주는 원본 게시물에 샘플 보고서를 첨부했습니다. 여기서 YEAR 변수는 데이터 프레임의 모든 변수에 대해 일정하며, 변수 VAR1, VAR2 및 VAR3은 변수 YEAR로 크로스 테이블됩니다. –

관련 문제