2017-12-10 2 views
0

나는 tensorflow를 처음 사용합니다. 내 모델을 훈련시키기 위해 데이터 세트를로드해야합니다. 그리고 내 데이터 세트의 샘플은 내가 tensorflow 문서에서 언급 한 코드로이 CSV 파일을로드tensorflow : csv 데이터 파일로드 및 모델 교육

TRAINING_FILE.iloc[0:5,0:5] 

    num_var_1 num_var_2 num_var_3 num_var_4 num_var_5 
0 -0.010655 0.040182 0.0  1.800000e-07 -0.011319 
1 -0.006542 0.157872 0.0  2.105000e-06 -0.010966 
2 -0.010626 0.089140 0.0  3.550000e-07 -0.011286 
3 -0.010626 0.227239 0.0  1.050000e-06 -0.011159 
4 -0.008947 0.160410 0.0  2.105000e-06 -0.010966 

처럼 난 내 교육 파일

train_fn = tf.contrib.learn.datasets.base.load_csv_with_header(
    filename = TRAINING_FILE, 
    target_dtype = np.int, 
    features_dtype= np.float32) 

을로드하고 난 스크립트를 컴파일 할 때 내가있어 방법입니다 .This 보인다 오류 다음

Traceback (most recent call last): File "train.py", line 31, in features_dtype = np.float32) File "/usr/local/lib/python2.7/dist-packages/tensorflow/contrib/learn/python/learn/datasets/base.py", line 48, in load_csv_with_header n_samples = int(header[0]) ValueError: invalid literal for int() with base 10: '-0.0106550312'

답변

1

그 모든 수레처럼 보이지만, load_csv_with_header DTYPE target_dtype (귀하의 경우 정수)와 라벨 열을 찾고있다. 이 열은 target_column 인수로 선택할 수 있지만 기본적으로 마지막 열입니다.

따라서 실제 값을 예측하는 경우 dtype 레이블을 float로 전환하거나 데이터에 레이블 열을 추가해야합니다.

관련 문제