2014-04-01 3 views
0

내가 할 수있는 일과 할 수없는 일, 그리고 쉬운 일이 무엇인지에 대해서는 잘 모르겠습니다.여러 개의 웹 서버를 실행하기 위해 hadoop을 사용할 수 있습니까?

필자는 hadoop이 mapreduce 작업을 수행하고 hdfs, 분산 파일 시스템을 제공하는 데 능숙하다는 것을 알고 있습니다.

다른 좋은 점은/사용하기 쉽습니다.

내 문제 : 데이터, mapreduce의 결과를 제공하고 싶습니다. 그리고 트래픽이 많아서 3 대의 프런트 엔드 서버가 필요합니다. Hadoop은 n 개의 runnning 노드 중 3 개에 서버를 배치 할 수 있습니까?

기본적으로 n 대의 컴퓨터에서 mapreduce를 실행하는 대신 3 대의 컴퓨터에서 사용자 지정 실행 파일 (내 서버)을 실행하고 싶습니다. 그리고 1 대의 머신이 실패 할 때, 그 hadoop은 다른 사용 가능한 머신에서 작업을 시작하는 것을 처리합니다.

내가 hadoop 클러스터에서 실행해야합니까? 또는 hadoop 클러스터가 mapreduce에만 사용되어야하며 hadoop 클러스터에서 데이터를 제공하기 위해 별도의 클라우드가 있어야합니까?

경험을 공유해 주셔서 감사합니다. 난 그냥 솔루션으로 현재 하둡을 고려하고

P.S은, 임은 귀하의 질문은 사실은 명확하지 않지만 여기 내 샷이

+0

정확하게 무엇이 필요한지 명확하지 않기 때문에 더 구체적으로 시도하십시오. – vefthym

+1

@vefthym 더 많은 설명을 추가했습니다. – Thomas

답변

0

에 묶여 있지.

Hadoop 작업의 결과를 표시 하시겠습니까? 일반적으로 Hadoop 작업은 그 결과를 HDFS에 씁니다. 당신이 할 수있는 것은 당신 자신의 OutputFormat 클래스를 만드는 것입니다. 예를 들어 XMLOutputFormat을 정의 할 수 있습니다.

하지만 좋은 점은 자신 만의 Writable을 만들 수 있다는 것입니다. Database Access with Apache Hadoop을 살펴보십시오. 이 자습서에서는 Hadoop 작업의 결과를 데이터베이스 시스템에 저장할 수 있습니다.

그러면 프론트 엔드가 데이터베이스에 쿼리하고 그 결과를 표시 할 수 있습니다.

+0

정확하지는 않지만 답변 해 주셔서 감사합니다. 내 질문을 편집했습니다. hadoop 클러스터를 사용하여 웹 서버 인스턴스를 m 개 실행하고 싶습니다. – Thomas

관련 문제