2015-02-03 2 views
0

웹 기반 응용 프로그램에서 Hadoop 프레임 워크를 구현할 계획입니다. 하지만 난 그냥 localhost에서 호스트. 분산 된 파일 시스템으로 mapreduce와 hdfs를 구현할 계획입니다. 문제는 내가해야 할 첫 번째 단계는 무엇입니까? 나는 무엇부터 시작해야 할까? Hadoop 프레임 워크에 대한 철저한 연구를했습니다. 그것이 인터넷에서 어떻게 작동하고 단어 카운트 예제를 시도해보십시오.기존 시스템에 Hadoop 프레임 워크를 구현하는 방법

답변

0

Hadoop은 대규모 데이터 처리를위한 분산 프레임 워크입니다. 귀하의 진술 "분산 파일 시스템으로 mapreduce 및 hdfs를 구현할 계획입니다."이 잘못되었습니다.

지도 축소는 분산 파일 시스템에서 사용할 수있는 프로그래밍 모델입니다. HDFS는 hadoop 분산 파일 시스템입니다. HDFS와 MapReduce는 함께 hadoop 프레임 워크에 설정됩니다.

hadoop을 사용하면 일괄 처리 인 오프라인에서 데이터 처리를 할 수 있습니다. 따라서 웹 응용 프로그램에서 직접 유용하지 않을 수 있습니다. 할 수있는 일은 백엔드 데이터베이스를 웹 애플리케이션 용 HBase로 사용하는 것입니다. Hbase는 데이터웨어 하우스/데이터베이스가 hadoop 위에 실행됩니다.

첫 번째 단계는 킥오프하려는 경우 컴퓨터 클러스터를 설정하는 것입니다. 5 개의 노드로 시작할 수 있습니다. 다른 방법으로는 클라우드 솔루션을 추천합니다. Amazon EMR로 이동하십시오.

도움이 될지 알려주세요.

+0

나를 고쳐 주셔서 감사합니다. 내 진술이 혼란스러워 보인다 .. 그래! 이것은 유용합니다! 나는 더 많은 것을 배우고 더 많은 것을 연습 할 필요가있다 :) –

관련 문제