2017-05-09 5 views
0

에 필요한 제어 어떤 수준 :모델 훈련을 구글 클라우드 ML을 사용하는 경우 구글 클라우드 ml의

공식 예를 https://github.com/GoogleCloudPlatform/cloudml-samples/blob/master/census/tensorflowcore/trainer/task.py 후크, is_client, MonitoredTrainingSession 및 다른 복잡성을 사용합니다.

구름이 흐르거나이 예제를 충분히 사용하고 있습니까 : https://github.com/amygdala/tensorflow-workshop/tree/master/workshop_sections/wide_n_deep?

문서는 모범 사례와 최적화 측면에서 약간 제한적이므로 GCP ML이 클라이언트/작업자 모드를 처리 할 것인지 또는 기기를 설정해야하는지 등을 예를 들어 설명하십시오. replica_device_setter 등등?

답변

1

CloudML Engine은 TensorFlow 프로그램을 작성하는 방법에 크게 의존하지 않습니다. 당신은 파이썬 프로그램을 제공하고, 서비스는 그것을 당신을 위해 실행합니다. environment variables (필요한 경우), 예를 들어, 작업 색인과 같은 분산 된 훈련을 수행하는 데 사용할 수 있습니다.

census/tensorflowcore은 작업을 수행하는 방법을 보여줍니다. "핵심"TensorFlow 라이브러리 - replica_device_setters, MonitoredTrainingSessions 등을 사용하여 "처음부터"모든 것을 수행하는 방법. 이는 궁극적 인 유연성을 위해 때때로 필요할 수 있지만 지루할 수 있습니다.

인구 조사/tensorflowcore 예제와 함께 census/estimator이라는 샘플도 표시됩니다. 이 예제는 불행하게도 contrib에있는 상위 레벨 라이브러리를 기반으로하므로 완전히 안정적인 API를 갖지 않습니다 (많은 비추천 경고 등을 기대합니다). TensorFlow의 차기 버전에서 안정화 될 것으로 기대하십시오.

특히 라이브러리 (Estimators)는 더러운 작업을 처리하는 상위 수준의 API입니다. TF_CONFIG을 구문 분석하고 replica_device_setter을 설정하고 MonitoredTrainingSession을 처리하고 필요에 따라 Hook을 처리하며 상당히 맞춤 설정할 수 있습니다.

당신이 가리킨 폭 넓은 예제가 기반으로하고 있으며 서비스에서 완전히 지원되는 라이브러리입니다.

관련 문제