2014-11-28 4 views
-1

새로운 기능 Python. 데이터 프레임이 있고 각 열 (모든 attr)에서 최소 - 최대 (0-1) 배율을 원합니다. MinMaxScaller 메서드를 찾았지만 데이터 프레임과 함께 사용하는 방법을 모릅니다.iPython에서 데이터 프레임의 최소 - 최대 크기 조정

from sklearn import preprocessing 

def sci_minmax(X): 
    minmax_scale = preprocessing.MinMaxScaler(feature_range=(0, 1), copy=True) 
    return minmax_scale.fit_transform(X) 

data_normalized = sci_minmax(data) 
data_variance=data_normalized.var() 
data_variance.head(10) 

오류는 'numpy.float64'개체에 'head'속성이 없습니다. 반환 유형 데이터 프레임이 필요합니다. scipy/numpy에는 head 메서드가 없습니다.

답변

0

pandas.DataFrame을 원하면 생성자를 호출해야합니다.

head으로 처음 10 개 레코드를 보는 것은 어떨까요?

numpy로도 쉽게 할 수 있습니다.

배열의 처음 10 개 레코드를 선택하려면 파이썬 구문은 array[:10]입니다. numpy 행렬을 사용하면 행과 열을 지정해야합니다. array[:10,] 또는 array[,:10]

+0

결국 나는 그랬습니다 : data_norm = (data - data.min())/(data.max() - data.min()) – SpeedEX505

+1

행별, 열별 또는 프레임 별 정규화 여부를 구분해야합니다. 가장 보편적 인 것은 아마도 열 단위입니다. 나는 당신의 코드가 프레임 단위 재배율을 산출한다고 생각한다. –

+0

그래, 난 당 열 싶어요. 어떻게 다시 작성해야합니까? – SpeedEX505

관련 문제