Apache Flink + RabbitMQ 스택을 사용하고 있습니다. 세이브 포인트를 수동으로 트리거하고 작업을 복원 할 수있는 기회를 알고 있지만 문제는 성공적인 체크 포인트 이후에 Flink가 메시지를 확인한다는 것이고 세이브 포인트를 작성하고 상태를 복원하려면 마지막 성공 세이브 포인트와 마지막 성공 체크 포인트 사이의 모든 데이터가 손실됩니다 . 체크 포인트에서 작업을 복원하는 방법이 있습니까? 그러면 재생 불가능한 데이터 소스 (예 : rabbitmq)의 경우 데이터 손실 문제를 해결할 수 있습니다. Btw, 모든 오버 헤드가있는 체크 포인트가있는 경우 사용자가이를 사용하도록하지 않는 이유는 무엇입니까?체크 포인트에서 Apache Flink 작업 복원
3
A
답변
4
개념적으로 세이브 포인트는 체크 포인트와 메타 데이터 비트를 제외하고 아무것도 아닙니다. 두 경우 (Savepoint 및 Checkpoint)에서 Flink는 모든 연산자, 소스 및 싱크의 상태에 대해 일관된 검사 점을 만듭니다.
검사 점은 오류 복구를위한 내부 메커니즘으로 간주됩니다. 그러나 검사 점은 configured to be externalized checkpoints 일 수 있습니다. 외부 체크 포인트는 작업이 종료 될 때 자동으로 정리되지 않으며 수동으로 프로그램을 다시 시작하는 데 사용될 수 있습니다.
RabbitMQ 소스에 대한 문제는 재설정 할 수없는 검사 점을 확인하여 일부 상태를 외부 시스템으로 푸시하기 때문에 일종의 Flink의 검사 점 의미를 위반하는 것입니다.
세이브 포인트를 트리거하고 나중에 작업을 즉시 종료하는 메커니즘을 사용하면 문제를 해결할 수 있습니까? 이렇게하면 세이브 포인트를 수행 한 후 검사 점이 트리거되는 것을 방지 할 수 있습니다.
관련 문제
- 1. Apache Flink : 로컬 모드의 다중 작업 관리자
- 2. Apache Flink DataSet 차이/빼기 작업
- 3. apache flink window order
- 4. Apache Flink 스트림 스케일링
- 5. Apache Flink Kafka Itergration
- 6. Apache Flink - groupBy
- 7. Apache Flink : 어떻게 배압을 처리합니까?
- 8. Apache Flink : 지연된 Datastream 만들기
- 9. Apache Flink - 최대 추적 가능
- 10. # Apache-flink : 데이터 관리를위한 유스 케이스
- 11. AWS EMR - Apache Flink 웹 클라이언트
- 12. Apache Flink (작업을 고유하게 태그 지정하는 방법)
- 13. Apache Flink - 입력에 고유 ID 할당
- 14. Apache Flink + CEP - 동일한 이벤트 감지
- 15. apache flink - 올바른 오류 처리 방법
- 16. 데이터 스트리밍을 위해 Apache Flink 사용
- 17. apache flink 데이터 집합 창 집계
- 18. Apache Flink : 최근 이벤트는 어떻게 처리됩니까?
- 19. Apache Derby 데이터베이스 복원
- 20. Flink Jobmanager가 작업 관리자를 볼 수 없습니다.
- 21. 작업 복사본의 루트 복원
- 22. 이클립스 작업 공간 복원
- 23. 설정 복원 작업
- 24. 오른쪽 조각으로 작업 복원
- 25. accurev에서 작업 공간 복원
- 26. Apache Flink : 런타임에서 상태 매개 변수를 외부에서 변경합니다.
- 27. KafkaProducer08 in Flink 예외
- 28. Flink RMQSource
- 29. Apache Flink CEP 시간 초과 패턴이 시간 창으로 정의되지 않았습니다.
- 30. Apache Flink JDBC InputFormat throwing java.net.SocketException : 소켓이 닫혔습니다.
예, 그게 내 문제를 해결할 것입니다. savepoint 이후 작업을 종료하는 방법이 있습니까? – user3237732
아니요. 현재로서는 불가능합니다. 현재 진행중인 작업 재조정을 위해 추가 될 예정입니다. –