0

코드 예 Deep Neural Network Regression with Boston Data을 이해하려고합니다.TensorFlow를 사용하여 Boston 주택 데이터 세트로드

데이터 세트는 here으로 설명됩니다. 그것에는 14 가지의 속성이 있습니다.

이 예제에서는 다음 코드를 사용하여 데이터를로드합니다.

# Load dataset 
boston = learn.datasets.load_dataset('boston') 
x, y = boston.data, boston.target 

내가 xy에 대한 자세한 내용을 알고 싶은

, 나는 다음있다.

>>> type(x) 
<type 'numpy.ndarray'> 
>>> type(y) 
<type 'numpy.ndarray'> 
>>> x.shape 
(506, 13) 
>>> y.shape 
(506,) 
>>> 

내 질문 : 데이터 세트는 두 개체 (13 개) 속성을 하나 하나와 다른로 구분 된 이유는

  1. ?
  2. 어떤 이유로이 부서가 만들어 졌습니까?

답변

1

boston.data의 13 개 열이 사용자의 기능입니다. boston.target의 1 열이 당신의 목표입니다. 분할이 완료되는 이유는 대부분의 경우 기계 학습 알고리즘이 기능과 대상을 별도의 데이터 구조로 요구하기 때문입니다. load_datasets 함수는 대부분 MDEV 열을 분리하여 사용자가 쉽게 예측할 수 있기 때문에 사람들이 예측하기를 원하는 기능입니다. 다른 말로하면, load_data 세트의 디자이너는 다른 13 가지 기능을 기반으로 주택 가격의 중앙값을 찾으려고한다고 가정합니다.

이 작업을 수행 할 필요가 없습니다. 당신은 귀하의 목표로 기능 중 하나를 선택할 수 있습니다. 주거 당 평균 객실 수인 RM을 예측하고 싶다고합시다. MDEV 컬럼을 다시 boston.data에 병합하고 RM을 분리하십시오. 그런 다음 RM을 대상으로 사용하십시오.

현재 내가 제공 한 링크가 깨져서 Google을 검색하여이 Boston Housing price tutorial을 찾았습니다. tensorflow에서 회귀를 원한다면 꽤 완벽 해 보입니다.

관련 문제