저는 Python과 Pandas를 처음 사용하며 UCI를 통해 심장병 데이터 세트를 가지고 놀고 있습니다. https://archive.ics.uci.edu/ml/machine-learning-databases/heart-disease/hungarian.datapandas 데이터 프레임 재구성 : 76 개의 항목마다 새로운 행
각 개인마다 76 개의 속성이 있고 303 명의 사람들이 있으므로 각 사람을 행과 76 개의 컬럼으로 끝내고 싶습니다. 데이터가 9 행으로 표시되기 때문에 데이터 프레임에 배치하는 데 문제가 있습니다.
공간 또는 개행 문자를 구분 기호로 사용하여 pandas 데이터 프레임으로 데이터 세트 가져 오기를 시도했지만
df = pd.read_table('https://archive.ics.uci.edu/ml/machine-learning-databases/heart-disease/hungarian.data', sep=' ')
DF이 같은 테이블에 결과 : 매 8 개 값 이후에 분할하고자에서 데이터를 방지하기 위해 아직없는 내가 어떤 조언을 감사하겠습니다
1254 0 40 1 1.1 0.1 0.2
-9.0 2 140.0 0.0 289 -9.0 -9.0 -9.0
0.0 -9 -9.0 0.0 12 16.0 84.0 0.0
0.0 0 0.0 0.0 150 18.0 -9.0 7.0
172.0 86 200.0 110.0 140 86.0 0.0 0.0
0.0 -9 26.0 20.0 -9 -9.0 -9.0 -9.0
방법 당신은에있을 수 있습니다 이것을 나눠서 다음에 새 행을 만듭니다. 여섯 번째 가치. 모든 76 번째 값은 'name'문자열이며 이는 한 사람의 데이터의 끝을 나타냅니다. 고맙습니다!
그것은 행할 수 있지만 고통스러운 dataframe의 rubikscubing입니다. 입력 파일이 그리 크지 않기 때문에 입력 문자열에서 작업하고 \ n과 name을 대체하여 정렬 된 행을 가져와 read_table을 제공합니다. – Boud