2014-04-29 3 views
0

나는 scikit-learn을하는 것이 아주 쉽고 홍채 데이터 세트의 샘플을 배우고 예측하는 몇 가지 예제를 검토하고있었습니다. 하지만이 목적을 위해 외부 데이터 세트를로드하려면 어떻게해야합니까?외부 데이터 세트로 작업하기

다음 형식의 데이터가있는 데이터 집합을 다운로드했습니다.

id attr1 attr2 .... label 
123 0 0 ..... abc 
234 0 0 ..... dsf 
.... 
.... 

예측을 배우고 그리려면이 데이터 세트를 어떻게로드해야합니까? 감사.

답변

0

하나의 옵션은 pandas입니다. 데이터를 가정하면, 공간 분리 : read_csvDataFrame를 반환하고 values 속성 데이터를 포함하는 NumPy와 배열을 반환

import pandas as pd 
X = pd.read_csv('data.txt', sep=' ').values 

.

X, y = X[:, :-1], X[:, -1] 
+0

내가 NumPy와 꽤 잘 알고, 그래서 나는 레이블을 현대 오토넷에 대해 동일한 기술을 사용 : 당신은 레이블로 위의 X의 마지막 열을 분리 할 수 ​​있습니다, 한 차원 배열 y로 말한다. 감사. – user3583395

관련 문제