2014-10-28 2 views
0

아래 배열의 이름과 색인을 인코딩하는 열이있는 큰 csv 파일이 있습니다. 예 :문자열로 데이터 인덱싱

time, dataset1[0], dataset1[1], dataset1[2], dataset2[0], dataset2[1], dataset2[2]\n 
0, 43, 35, 29, 21, 59, 39\n 
1, 21, 59, 39, 43, 35, 29\n 

아이디어가 있습니다 (배열에 훨씬 많은 데이터가 있음).

아이디어를 어떻게 효율적으로 파싱/스트립하면 될까요?

[편집]

은 이상적으로는이 같은 구조 후 해요 : 인덱스의이 라벨에서 제거하고 nparray 지표로 설정 한

time dataset1 dataset2 
0 0 [43,35,29] [21,59,39] 
1 1 [21,59,39] [43,35,29] 

.

답변

2
from pandas import read_csv 
df = read_csv('data.csv') 

print df 

는 출력으로 제공합니다 :

>>> 
    time dataset1[0] dataset1[1] dataset1[2] dataset2[0] dataset2[1] \ 
0  0   43   35   29   21   59 
1  1   21   59   39   43   35 

    dataset2[2] 
0   39 
1   29 
+0

감사합니다,하지만 난 (더 쉽게 만들 것) 배열 인덱스를 형성하기 위해 열 레이블에서 제거 인덱스를하고 싶습니다. 나는 이것을 OP에서 조금 분명히했다. – AndyM

+0

@AndyM 자신이 시도한 코드와 멈춘 위치의 코드를 표시 할 수 있습니까? – BioGeek

+0

나는 이것을 수행하는 방법을 찾지 못해서 실제로 어떤 코드도 갖고 있지 않다. 내가 여는 대괄호로 문자열을 분할해야하는지 여부. 그것이 내가 시각적으로 파일을 검사하고 (헤더를 무시하고) 각 파일에 대한 스크립트를 맞출 수 있지만 영리한 쉬운 방법이 있는지 궁금해했습니다. – AndyM