[int id, int value]로 구성된 들어오는 튜플의 평균을 Storm으로 계산하고 싶습니다. 볼 수 있듯이 필자는 필드 그룹을 사용하여 데이터를 분할 할 수 없습니다. 이 계산을 배포하려면 토폴로지 아키텍처가 필요하며 각 볼트 인스턴스 내에서 미니 배치를 수행하고 집계하는 유일한 방법이 필요합니다.Storm에서 튜플의 전역 평균을 계산하려면 Trident를 사용해야합니까?
트라이던트가 폭풍 내에서 미니 배치 처리를 수행하는 적절한 솔루션이라는 것을 이해했습니다.
속성을 기반으로 데이터를 분할 할 수없는 경우 storm-like, global count, std-devs와 같은 글로벌 분석을 계산하는 가장 좋은 방법은 무엇입니까? 모든 토폴로지 예제?
모두를 그룹화하여 평균을 계산하는 방법에 따라 다릅니다. 스톰 토폴로지는 연속적인 데이터 스트림을 처리하도록 설계되었으므로 우선 토폴로지의 수명, 시간대, 다른 무언가에 대해 데이터를 그룹화하여 평균을 계산하는 방법을 결정해야합니다. –
수백만 개의 튜플을 처리해야한다는 것을 의미하는 매우 큰 시간 창이 있습니다. – simon