제 질문과 관련하여 저는 파이썬으로 작성된 스트리밍 프로세스를 가지고 있습니다.각 키에 대해 다른 Reducer 프로세스를 사용하도록 Hadoop을 구성 하시겠습니까?
각 Reducer
은 sys.stdin
을 통해 여러 키와 관련된 모든 값을 가져옵니다.
sys.stdin에 하나의 키와 관련된 값만 있으면 좋을 것입니다. Hadoop에서도 가능합니까? 키마다 다른 프로세스가 완벽하다고 생각하지만이 동작을 제공하는 구성을 찾을 수 없습니다.
나를 도와 줄 수있는 정보 나 코드를 누군가가 도와 줄 수 있습니까?
왜 각 감속기를 단일 키로 제한 하시겠습니까? – highlycaffeinated