2016-07-13 8 views
8

EMR/EC2 클러스터에서 분산 텐서 흐름을 실행하려고하지만 클러스터의 다른 인스턴스를 지정하여 코드의 일부를 실행하는 방법을 모르겠습니다.AWS 클러스터에서 TensorFlow를 실행하는 방법은 무엇입니까?

설명서에서 그들은 tf.device("/gpu:0")을 사용하여 GPU를 지정했습니다. 하지만 EMR 클러스터에서 마스터 CPU와 5 개의 다른 슬레이브 GPU 인스턴스를 실행 중이고 일부 코드를 실행하도록 GPU를 지정하려면 어떻게해야합니까? 이름을 확인할 수 없다는 오류가 발생하므로 인스턴스의 공개 DNS 이름을 tf.device()에 입력 할 수 없습니다.

답변

0

AWS는 EC2 클러스터에서 분산 된 TensorFlow를 쉽게 사용할 수 있도록 몇 가지 코드를 출시했습니다.

이 부분은 github repository입니다. 모든 것은 README.md 설명하지만 짧은 이야기는 그것이 AWS가

  • 보안 그룹에 AMI를 딥 러닝 AWS와
  • 탄성 파일 시스템
  • EC2 인스턴스를 스택을 만들 것이라고하고 EFS가 장착되어
  • EC2 인스턴스가 구성되어 마스터 노드에서 명령을 실행하여 분산 텐서 흐름 실행을 쉽게 실행할 수 있습니다 (TensorFlow의 Distributed Training 실행 섹션 참조).
관련 문제