2016-08-27 8 views
2

파이썬에서 numpy 배열로 아래의 파일 형식을 읽고 싶습니다.텍스트 파일의 데이터를 파이썬에서 numpy 배열로 읽어들입니다.

ADIDGoogle#8a65c466-****-4a7e-****-0836c8884dae 2016-06-01 17:55:53 
ADIDGoogle#8a65c466-****-4a7e-****-0836c8884dae 2016-06-01 17:55:53 
ADIDGoogle#8a65c466-****-4a7e-****-0836c8884dae 2016-06-01 17:55:53 
ADIDGoogle#8a664a70-****-4103-****-4f7e6cb9a33a 2016-06-01 13:20:02 
ADIDGoogle#8a664a70-****-4103-****-4f7e6cb9a33a 2016-06-01 13:35:48 
ADIDGoogle#8a664a70-****-4103-****-4f7e6cb9a33a 2016-06-01 13:26:20 
ADIDGoogle#8a664a70-****-4103-****-4f7e6cb9a33a 2016-06-01 13:31:12 
ADIDGoogle#8a664a70-****-4103-****-4f7e6cb9a33a 2016-06-01 13:19:17 
ADIDGoogle#8a664a70-****-4103-****-4f7e6cb9a33a 2016-06-01 13:20:02 
ADIDGoogle#8a664a70-****-4103-****-4f7e6cb9a33a 2016-06-01 13:36:39 
ADIDGoogle#8a664a70-****-4103-****-4f7e6cb9a33a 2016-06-01 13:31:12 
ADIDGoogle#8a664a70-****-4103-****-4f7e6cb9a33a 2016-06-01 13:35:48 

'\ t'로 구분 된 세 개의 열이 있습니다. 나는 날짜와 시간이 하나의 열에 있고 다른 열에는 id가있는 numpy 배열로 이것을 읽고 싶다.

내가

Data = np.loadtxt(filename,dtype='string',usecols=(1,2),delimiter="\t") 

를 사용하여 시도했지만 같이 나에게 오류를주고있다 : 모든

IndexError: list index out of range 

답변

2

먼저, 파일의 # 문자 numpy는 각각 "ADIDGoogle"이후 모든 것을 생각하게합니다 행은 주석입니다. comments kwarg (np.loadtxt)를 사용하여 주석 문자를 변경할 수있는 것으로 보입니다. 그러면 구분자 문제가 남은 IndexError이 해결됩니다. 당신은을 통해

1

읽을 수 genfromtxt 라인 별

import numpy as np 

fname = "./data.txt" 

with open(fname, 'r') as f: 
    data = np.genfromtxt(f,comments="!",dtype="string",usecols=(1,2)) 

print data 
관련 문제