2016-09-11 7 views
1

나는 나를 도울 수있는 뭔가를 찾으려고했지만 할 수 없었습니다. 내 질문에 이미 답변 한 사람이 있으면 나와 연결해 주시면 고맙겠습니다.팬더 데이터 프레임 Transpose

필자는 행 방식 기능이있는 팬더 데이터 프레임을 가지고 있습니다. 예를 들어 :

Patient_ID Feature_Id Feature_Value 
0   3   10   0.30 
1   3   50   0.20 
2   3   60   1.00 
3   4   10   0.25 

나는 열 현명한 기능 (팬더 본질적으로 열)로 변환해야 - 무언가를 아래와 같이 :

Patient_Id 10 50 60 
     3 0.30 0.2 1.0 
     4 0.25 Nan Nan 
+0

@ayhan 죄송합니다. 여기에 표 형식을 지정하는 방법에 대해 도움을 주실 수 있습니까? – Ahsan

+1

DataFrame을 여기에 직접 붙여 넣고 DataFrame을 선택하는 동안'{}'을 클릭하십시오. 코드로 형식을 지정합니다. 나는'|'문자를 제거하고 빈 줄을 사용했습니다. 현재 편집료를 보려면 [편집] (http://stackoverflow.com/posts/39437387/edit)을 클릭하십시오. – ayhan

답변

1

당신은 시도 할 수 pd.pivot_table

In [16]: pd.pivot_table(df, index='Patient_ID', values='Feature_Value', columns='Feature_ID') 
Out[16]: 
Feature_ID 10 50 60 
Patient_ID     
3   0.30 0.2 1.0 
4   0.25 NaN NaN 

두 개 이상의 항목이있는 경우 수행 할 작업을 지정해야하는 경우 (예를 들어 있지 않은 경우) aggfunc 매개 변수를 사용할 수 있습니다 (기본값 평균을 계산하는 것입니다).

+0

행 선택 열에서 기능 선택 기술을 실행해야합니다. 나는 그렇게하기가 어렵다는 것을 알고있어, 그래서 그것들을 컬럼으로 변환한다. 행렬이 극단적으로 희소하기 때문에 이상하지 않습니다. Feature_Id 열에있는 동안 해당 기능에 대한 상관 관계 통계를 찾을 수있는 방법이 있습니까? – Ahsan

+0

@Ahsan 정확히 당신이 상관 관계를 찾고자하는 것을 정확히 이해하지 못했습니다. 'df.T.corr()'을 시도해보고, 당신이하려고하는 것이 아닌지 더 자세히 기술 할 수 있습니까? –

+0

Feature_Id 열에는 특정 주제를 분류하는 모든 기능이 있습니다. 수천 가지 기능이 있으며 올바른 라벨을 선택하는 데 더 많은 기여를하는 기능을 선택할 수 있다고 생각합니다. 라벨은 바이너리입니다. 따라서 기능과 종속 변수 (레이블) 간의 상관 관계를 찾는 것이 도움이 될 수 있습니다. 어쨌든 지금은 그 아이디어입니다. – Ahsan