2017-05-09 1 views
1

저는 팀과 함께 학교 프로젝트에서 Python을 사용하여 대용량 데이터 세트를 분석해야합니다. 데이터는 이미지 형식 (jpeg 파일)입니다. 분석에는 이미지가 포함되므로 TensorFlow, OpenCV 등을 사용할 것입니다. 데이터 세트가 크기 때문에 EC2에서 Python을 실행하고 S3에 데이터 세트를 저장하는 방법을 모색 중입니다. 1) EC2에 Python (3.5)을 설치하고 파일이 저장된 S3 버킷에 연결하십시오. 2) 모든 팀 구성원 (5 명)이 원격으로 서버에 액세스하고 데이터 세트/파일에 대해 테스트를 실행할 수있는 다중 사용자 환경을 만듭니다. AWS에서 필자의 스킬 레벨은 기본 수준입니다. 어떤 도움을 주셔서 감사합니다.AWS EC2에 Python 및 Jupyter 설치

+0

S3에서 /로 복사하려면 _awscli_ (http://docs.aws.amazon.com/cli/latest/userguide/installing.html)을 사용하십시오. – Misha

답변

0

AWS CLI를 사용하는 것이 좋습니다 만 먼저 설정해야 할 몇 가지 사항이 있습니다.

  1. 계정을 만들고 사용자를 만들려면 IAM 콘솔을 입력하십시오. 나는 그들 모두를 같은 그룹에 할당하고 그들 모두에 대해 하나의 허가 정책을 정의하고자한다고 가정합니다. EC2 및 S3에만 액세스해야합니다. IAM 서비스에 대한 완전한 실무 지식이 필요합니다 (상대적으로 적음).

  2. EC2 인스턴스가 S3에 액세스 할 수 있도록 역할을 만듭니다. 자습서 this을 따르십시오.

  3. AWS CLI을 사용하여 EC2 인스턴스에 액세스하십시오. 설치/개발 워크 플로우는 리눅스 워크 플로우를 아주 가깝게 모방해야합니다.