2016-09-29 3 views

답변

5

전처리 파이프 라인을 BigQuerySource으로 변경하십시오 (CSV 샘플에서와 동일한 Features 클래스 사용). 다음은 그 예입니다.

feature_set = CsvFeatures() 
train_query = “SELECT …” 
valid_query = “SELECt …” 
train = pipeline | 'read_train' >> beam.Read(beam.io.BigQuerySource(query=train_query)) 
eval = pipeline | 'read_valid' >> beam.Read(beam.io.BigQuerySource(query=valid_query)) 
(metadata, train_features, eval_features) = ((train, eval) | 
    ml.Preprocess('Preprocess', feature_set)) 
관련 문제