2013-08-08 5 views
2

[int id, int value]로 구성된 들어오는 튜플의 평균을 Storm으로 계산하고 싶습니다. 볼 수 있듯이 필자는 필드 그룹을 사용하여 데이터를 분할 할 수 없습니다. 이 계산을 배포하려면 토폴로지 아키텍처가 필요하며 각 볼트 인스턴스 내에서 미니 배치를 수행하고 집계하는 유일한 방법이 필요합니다.Storm에서 튜플의 전역 평균을 계산하려면 Trident를 사용해야합니까?

트라이던트가 폭풍 내에서 미니 배치 처리를 수행하는 적절한 솔루션이라는 것을 이해했습니다.

속성을 기반으로 데이터를 분할 할 수없는 경우 storm-like, global count, std-devs와 같은 글로벌 분석을 계산하는 가장 좋은 방법은 무엇입니까? 모든 토폴로지 예제?

+0

모두를 그룹화하여 평균을 계산하는 방법에 따라 다릅니다. 스톰 토폴로지는 연속적인 데이터 스트림을 처리하도록 설계되었으므로 우선 토폴로지의 수명, 시간대, 다른 무언가에 대해 데이터를 그룹화하여 평균을 계산하는 방법을 결정해야합니다. –

+0

수백만 개의 튜플을 처리해야한다는 것을 의미하는 매우 큰 시간 창이 있습니다. – simon

답변

2

Trident-ML을 사용하여 계산 된 평균, 표준 편차 및 계수와 같은 스트림 통계를 쉽게 계산할 수 있습니다. 트라이던트 토폴로지 내에서 논문 통계를 계산하는 방법을 설명하는 a section in the README이 있습니다.

희망이 있습니다.

관련 문제