100 개의 파일이 있다고 가정하고 모든 파일을 반복합니다. 각 파일에는 다음과 같은 여러 속성의 레코드가 있습니다. (모든 파일을 읽기 전에 속성의 총 개수를 알 수 없음)Python에서 피벗 데이터 생성
모든 파일을 읽은 후 20 개의 다른 속성과 다음 정보를 얻는 간단한 경우를 가정합니다. :
File_001: a1, a3, a5, a2
File_002: a1, a3
File_003: a4
File_004: a4, a2, a6
File_005: a7, a8, a9
...
File_100: a19, a20
[업데이트] 또는 각 라인은 하나 개의 파일과 하나 개의 속성 사이에 단일 일치하는 또 다른 표현에 : 나는 "반대"통계 테이블, 즉 생성 할 수있는 방법
File_001: a1
File_001: a3
File_001: a5
File_001: a2
File_002: a1
File_002: a3
File_003: a4
File_004: a4
File_004: a2
File_004: a6
...
File_100: a19
File_100: a20
가 :
a1: File_001, File_002, File_006, File_083
a2: File_001, File_004
...
a20: File_099, File_100
어떻게 파이썬 (2.7.x)에서 할 수 있습니까? (팬더가 있든 없든 나는 팬더가 도움이된다고 생각한다)
감사합니다! 그것은 완벽하게 작동합니다! 출력 [202]을 DataFrame으로 어떻게 설정합니까? 그래서 html 또는 csv로 내보낼 수 있습니까? 결과는 내보낼 방법이없는 것 같습니다. –
그리고 각 줄에 하나의 속성 만있는 원본 DF가있는 경우 (예 : 'File_001 a1' (개행)'File_001 a2' (개행)'File 002 a1' 등 욕망의 결과를 얻기 위해 복합 코드 라인을 조정하는 법 (DF처럼)? –
@JimRaynor, 대답을 업데이트했습니다. – MaxU