저는 Hadoop, MapReduce, Big Data를 처음 사용하고 있으며, 제가 작업중인 프로젝트에서 매우 흥미로운 특정 유스 케이스에 대한 실행 가능성을 평가하려고합니다. 그러나 내가 달성하고자하는 것이 A) 가능하거나 B) MapReduce 모델과 함께 권장되는지 확실하지 않습니다.실행 가능한 MapReduce 유스 케이스인가, 실행 가능한가?
우리는 본질적으로 상당한 양의 위젯 (알려진 데이터 구조)과 가격 책정 모델 (JAR 파일로 성문화되어 있음)을 가지고 있으며, 우리가 할 수 있기를 원하는 것은 위젯과 가격 모델의 모든 조합을 실행하여 결과를 결정하는 것입니다 모델 순열 전반에 걸친 가격 책정. 가격 결정 모델 자체는 각 위젯을 검사하고 모델 내의 의사 결정 트리를 기반으로 가격을 결정합니다.
내 생각에 상품 인프라 관점에서 병렬 처리하는 것이 합리적이지만 기술적 인 관점에서 볼 때 MR 작업 내에서 외부 모델을 실행할 수 있는지 그리고 실용적인 관점에서 볼지 모르겠다. 기술에 유스 케이스를 강제합니다.
질문은되므로가 능합니다; 이런 식으로 구현하는 것이 이치에 맞습니까? 이 시나리오에 더 적합한 다른 옵션/패턴은 무엇입니까?
편집 시간이 지남에 따라 부피와 품종이 커질 것입니다. 지금 논의를 위해 가정용 테라 바이트의 위젯과 10 가지 가격 모델이 있다고 가정 해 보겠습니다. 그런 다음 여러 테라 바이트와 100 가지 가격 책정 모델을 기대할 수 있으며, 위젯이 변경되거나 추가되거나 가격 모델의 새로운 카테고리가 도입 될 때마다 순열의 실행이 자주 발생합니다.
흥미로운 내용 ... 보유한 데이터의 양에 대해 더 구체적으로 설명 할 수 있습니까? MapReduce, Hadoop 및 BigData는 훌륭하지만 솔직히 처리 할 테라 바이트 이상의 원시 데이터가 없으면 과장입니다. –