2016-07-28 2 views
0

$ t $가 관심 변수 인 튜플 $ $ (t, q) $로 구성된 데이터 스트림이 있다고 가정합니다. 최대 $ t $로 튜플을 추적하는 분산 된 방법이 있습니까? $ t $가 글로벌 최대치를 초과하면 방출됩니다.Apache Flink - 최대 추적 가능

안부, 케빈

답변

1

는 FLINK의 상태 기능을 고려 있나요? (https://ci.apache.org/projects/flink/flink-docs-release-1.0/apis/streaming/state.html)

나는 Flink 자신에게 매우 익숙하다. 그러나 나는 그것이 당신이 찾고있는 기능을 입증했다고 생각한다.

+0

감사합니다. 네,하지만 저는 국가의 공유에 대해 고려하고 있습니다. 상태가 커지면 상태를 유지하기 위해 많은 네트워크 트래픽이 생성됩니다. 나는 지금 '공동 그룹'을 조사 중이다. 아마도 가능성이 있을까? –

+1

제가 이해하는 한, State는 항상 TaskManager에 로컬입니다. 그러나 스트림을 키 입력하면 동일한 키가있는 스트림의 부분이 항상 동일한 TaskManager로 이동합니다. 하지만 이것이 당신이 원하는 데이터/데이터로 할 수있는 것이 아니라고 생각합니다!? – Claudi

+0

아니요, 슬프게도 가입/코 그룹화해야하므로 글로벌 상태로 유지해야합니다 (효율적인 것은 아닙니다). –

관련 문제