스파크 스트리밍을 위해 AWS EMR을 사용합니다. Kinesis 스트림에서 데이터를 읽는 EMR에 단계를 추가합니다. 필요한 것은이 단계를 중단하고 새 단계를 추가하는 접근법입니다.AWS EMR에서 장시간 실행되는 스파크 스트리밍 단계를 중지하는 방법
지금 Spark 드라이버에서 스레드를 생성하고 메시지에 대한 SQS 대기열을 수신하고 메시지를 받으면 sparkContext.stop()
으로 전화합니다. 나는 배치 자동화에 Chef를 사용합니다. 그래서 새로운 인공물이있을 때, 메시지는 SQS에 넣어지고, EMR은 그것을 읽고 단계를 멈춘다. 그러면 요리사가 EMR API를 사용하여 새로운 단계를 추가합니다.
내 질문은 이것이 EMR에서 장기간 스트리밍 작업을 중단하는 올바른 방법일까요? EMR이 아닌 독립 실행 형 클러스터에 어떻게 설치 되었습니까?