2016-07-17 3 views
0

치수가 28 x 28 인 200 개의 이미지에 대한 교육 데이터 세트가 있습니다. 200 x (28 * 28) 모양의 train_dataset에 저장했습니다. 라벨은 모양의 한 차원입니다 훈련 : (200, 28, 28) (200,)

이 훈련 데이터를 logistic regression.ie의 scikit-model에 맞춰야합니다. 적합 (train_dataset, train_label) 하지만 맞는 맞춤 매개 변수 (X, Y, sample_weight = 없음)이 어레이 (X) < 2 또한 어레이 (Y)를는 .dim < 2.

을는 .dim 그래서 거기가 스케일 다운에 대한 대안 train_dataset하지만 엄청난 양의 공간이 필요합니다. 즉, 크기가 200 x (28 * 28) 인 2 차원 배열을 사용하고 1 차원 차원의 train_label에도 매핑하면됩니까?
train_dataset을 훈련하는 방법 차원> = 3?
동일하게 n 차원으로 일반화 할 수 있습니까? 훈련 동안

오류 :training scikit-model을 이용한 Logistic Regression의 N 차원 데이터 세트

ValueError: Found array with dim 3. Estimator expected <= 2. 

답변

0

경우 이미지는 항상 좋은 아이디어를 다루는 것은 PCA을 적용하거나 주성분 분석 데이터 세트의 크기를 줄일 경우.

.fit() *이 함수를 허용하지만 (28 PCA 예를 들어 귀하의 분산의 대부분을 캡처 (60 개) 기능과 같이 얻을 적용 형태의 데이터 집합을 얻을 수 있도록 2 차원 배열은 그래서 당신은이 아래로 라벨을 받아 60).

PCA here에 대한 추가 정보.