내가 틀렸다면 정정하십시오.하지만 Hadoop은 다른 노드 간의 통신을 위해 MPI를 사용하지 않습니다.Hadoop이 MPI를 사용하여 구현되지 않는 이유는 무엇입니까?
기술적 인 이유는 무엇입니까?
나는 약간의 추측을 위험 할 수 있지만, MPI가 어떻게 구현되는지 "나는 알고 있는지"알지 못한다.
생각해 보니, 하둡의 내부도 완전히 익숙하지 않습니다. 개념적 수준 (map/combine/shuffle/reduce 및 높은 수준에서 작동하는 방식)에서 프레임 워크를 이해하지만 핵심 구현 세부 사항을 알지 못합니다. 저는 항상 Hadoop이 셔플 단계에서 TCP 연결을 통해 직렬화 된 데이터 구조 (아마도 GPBs)를 전송한다고 가정했습니다. 그것이 사실이 아닌지 알려주세요.
그래서 MPI에 내재 된 이유는 아닙니다 패러다임 자체, 현재의 구현인가? 따라서 현재와 같이 네트워크 메시지가 손상되거나 변덕스러운 노드가 MPI 시스템을 중단시킬 수 있습니다. 이 두 요소가 모두 제거되었다고 가정 해 봅시다. MPI를 사용하여 Hadoop을 구현하지 않는 이유가 있습니까? – artif
나는 이것이 합리적인 대답이라고 생각한다. –