데이터 흐름을 시작하기 만하고 분기를 달성하는 방법에 대해 몇 가지 질문이 있습니다.데이터 브랜칭 및 변환 적용
내가 단어의 흐름을 가지고 있다고 말하면 각 알파벳으로 시작하는 모든 단어를 필터링하고 싶다면 어떻게 할 수 있습니까? 각 데이터에 필터를 적용하고이를 PCollection에 할당해야합니까? 그렇다면 각 필터에 대해 유용한 데이터가 아닌 전체 데이터 스트림을 읽고 26 개의 PCollection을 만들어 각 알파벳으로 시작하는 글자를 만들어야합니다. 동일한 데이터를 반복하지 않고도 더 좋은 방법이 있을까요?
또한 일부 알파벳에 대해 윈도우 처리를 적용하고 나머지는 직접 스트리밍하고 싶습니다. 어떻게해야합니까?
감사합니다.
감사합니다. 몇 가지 샘플 프로그램이 있으면 좋을 것입니다. – Neoster
예가 추가되었습니다. – danielm