boto3을 사용하여 새 클러스터를 생성 할 때 기존 클러스터의 구성 (종료 됨)을 사용하여 복제하려고합니다. 내가 아는 한 emr_client.run_job_flow
은 모든 구성 (Instances, InstanceFleets etc
)을 매개 변수로 제공해야합니다. EMR 용 aws 콘솔에서 할 수있는 것처럼 기존 클러스터에서 복제 할 수있는 방법이 있습니까?boto3을 사용하여 기존 EMR 클러스터 복제하기
1
A
답변
0
은 내가 당신을 추천 할 수 있습니다 무엇, 당신의 클러스터를 해고하는 AWS CLI을 사용하고 있습니다.
클러스터 구성의 버전을 허용하며 json 파일을 사용하여 단계 구성을 쉽게로드 할 수 있습니다.
[
{
"Name": "Step #1",
"Type":"SPARK",
"Jar":"command-runner.jar",
"Args":
[
"--deploy-mode", "cluster",
"--class", "com.your.data.set.class",
"s3://path/to/your/spark-job.jar",
"-c", "s3://path/to/your/config/or/not",
"--aws-access-key", "ACCESS_KEY",
"--aws-secret-key", "SECRET_KEY"
],
"ActionOnFailure": "CANCEL_AND_WAIT"
}
]
(여러 단계가 너무 좋아요입니다) 당신은 항상 동일하게 구성 클러스터를 시작할 수 있습니다 그 후
을 : 같은
aws create-cluster --name "Cluster's name" --ec2-attributes KeyName=SSH_KEY --instance-type m3.xlarge --release-label emr-5.2.1 --log-uri s3://mybucket/logs/ --enable-debugging --instance-count 1 --use-default-roles --applications Name=Spark --steps file://step.json
는 step.json 보이는 곳.
예를 들어 전체 클러스터를 예약하고 AirFlow 개의 작업을 수행하십시오. 당신이 정말로 에게 Boto3을 사용하려는 경우
는하지만, 나는 describe_cluster() 방법을 사용하여 전체 정보를 얻을하고 새를 불에 반환 된 객체를 사용하는 데 도움이 될 수 있다고 가정합니다.
관련 문제
- 1. 는 EMR 클러스터
- 2. 스파크가있는 AWS DataPipeline EMR 클러스터
- 3. AWS EMR kerberizing 클러스터 hadoop.security.AccessControlException
- 4. Amazon EMR : 데이터로 클러스터 초기화
- 5. Amazon EMR 클러스터 다시 시작
- 6. 기존 안드로이드 스튜디오 프로젝트 복제하기
- 7. EMR 클러스터 마스터에서 외부로 스파크 제출 사용
- 8. 공용 IP 주소가없는 EMR 클러스터 만들기
- 9. AWS EMR 클러스터 스트리밍 단계 : 잘못된 요청
- 10. S3에서 pyspark의 EMR 클러스터 노드로 파일로드
- 11. ID에서 클러스터 개체 가져 오기 Amazon EMR
- 12. EMR 클러스터 외부에서 스파크 클라이언트를 실행하고 YARN
- 13. EMR & Spark 클러스터 생성 후 종속성 추가
- 14. EMR 클러스터 용 코어 수 얻기
- 15. 다른 계정의 EMR 클러스터 및 s3 파일을 사용하여 작업 실행
- 16. boto3을 사용하여 기존 S3 키의 Content-Type을 어떻게 설정합니까?
- 17. 기존 EMR 클러스터에서 EmrActivity를 어떻게 실행합니까?
- 18. 파이어 폭스를 사용하여 버추얼 박스에서 기존 가상 머신 복제하기
- 19. jquery를 사용하여 복제하기
- 20. Django를 사용하여 Failblog 복제하기
- 21. boto3을 사용하여 subnet_id로 route_table_id 찾기
- 22. boto3을 사용하여 CloudFront 배포본 삭제하기
- 23. AWS 데이터 파이프 라인 구성 EMR 클러스터 실행 스파크
- 24. 기존 하둡 클러스터 이름 변경
- 25. oracle의 기존 테이블에 클러스터 추가
- 26. 포스트 그레스 XL은 기존 클러스터
- 27. 사전 빌드 기존 스파크 클러스터
- 28. 다른 EMR 작업에서 EMR 클러스터의 JobFlowId를 호출하는 방법이 있습니까?
- 29. AWS EMR 클러스터 또는 이름 노드의 스냅 샷 생성 가능성
- 30. EGit을 사용하여 git에서 Eclipse로 복제하기
가능한 복제본 : https://stackoverflow.com/questions/43579746/how-do-i-apply-security-configuration-on-existing-emr-cluster-using-boto3 –
두 질문을 모두 읽으십시오. 다른. –