2011-09-02 2 views
9

the awesome Yahoo! Hadoop tutorial을 따라 왔으며 가상 컴퓨터 환경을 설정하는 데 효과적이었습니다 (튜토리얼의 모듈 3). 하지만 지금은 HDFS 섹션 (모듈 2)에 난처한 상황에 처해 있으며 Windows 관련 튜토리얼이 있다면 더 쉬울 수도 있다고 생각합니다. 내가 this one 다음을 시도했지만 일부 단계가 옳지 않았습니다. 나는 내 윈도우 7 머신에서 잘 작동 할 좋은 튜토리얼을 찾으려고 노력해 왔지만, 조금은 고생했다. 이 일을하기에 좋은 곳이 있습니까? Hadoop은 리눅스 사용자들에게 매우 적합한 것처럼 보입니다. 불행히도 저는 Windows 7 인 직장 랩톱을 사용해야 만합니다.이 작업을 수행 할 수 있습니까, 아니면 실제로 Linux 사용자 만 사용할 수 있습니까?Windows 7 컴퓨터에서 Hadoop 개발을위한 온라인 자습서가 있습니까?

답변

7

야후 개발자 네트워크의 하둡 튜토리얼은 오래된 및 문제가있다. 단계 중 절반이 전혀 작동하지 않았습니다 (Windows 7의 VMware Player에서 이미지를 실행 중이었습니다). 나머지 절반은 모호했습니다. Java 코드 예제는 제대로 작성되지 않았으므로 컴파일되지 않습니다. 여하튼, 이전 Hadoop API 용으로 작성되었습니다.

나는이 튜토리얼을 포기하고 대신 Cloudera Demo VM 이미지를 사용했다. 이것은 Hadoop, Pig, Hive, HBase 등으로 사전 구성되어 있습니다. 한 번에 업무에 종사했고 Hadoop 작업 및 돼지 스크립트를 컴파일하고 실행하는 데 문제가 없었습니다.

메인 지원 페이지 (https://ccp.cloudera.com/display/SUPPORT/Cloudera의 + Hadoop + Demo + VM)에있는 Cloudera Demo VM 다운로드는 모두 64 비트입니다. 내가 지금했던 것처럼 32 비트 버전을 찾고 있다면 https://downloads.cloudera.com/cloudera-demo-0.3.7.vmwarevm.tar.bz2

이 패키지에는 Gnome 데스크탑이있는 Ubuntu 10.10에서 실행되는 약간 오래된 버전의 Cloudera distro (CDH3u0)가 있습니다. 내 Hadoop 작업을 컴파일하기 위해 이클립스를 설치했지만 문제가 있다고 들었던 Hadoop 플러그인을 설치하려고하지 않았다. 처음으로 나는 실수로 시스템의 업데이트 관리자를 통해 Cloudera 배포판을 CDH3u3으로 업데이트 한 실수를 저 지르었고 이것이 나의 Hadoop 구성을 엉망으로 만들었습니다. 제대로 재구성하는 방법을 모르기 때문에 원래 이미지에서 시작했습니다. 내게는 클라우 데라 배포판에 불행하게도 export JAVA_HOME=/usr/lib/jvm/java-6-sun

, 내가 하둡에 익숙한 자바 개발자 친구하기 전에 오래된 YDN 튜토리얼과 시간의 톤을 낭비 뾰족한 :

는 돼지가 실행 얻으려면, 먼저 JAVA_HOME 변수를 설정해야 .

1

나는 지금도 하둡을 배우려고하고 있으며 가상 박스 (http://www.virtualbox.org/)를 다운로드하고 일부 Linux 이미지를로드하고 자습서를 시작했습니다.

cloudera에서 사전 제작 된 hadoop 설정 이미지를 얻을 수도 있습니다. 나는이 방법이 당신의 주 기계에 설치하고 설정하는 것보다 훨씬 낫다고 생각합니다. 문제가 발생하면 주 기계가 영향을 미치지 않을 것입니다 (가상 리눅스 이미지의 오래된 사본으로 되돌 리거나 긁어 낼 수 있기 때문입니다 아무런 영향도없이 다시 시작하십시오.)

행운을 빈다.

+0

감사합니다. 나는 VirtualBox를 통해 그것을 시도 할 것이다. – Steph

1

Windows에서 Hadoop을 개발하는 것은 가능하지만 제대로하기가 어렵습니다. Cygwin을 설치하고 모든 환경 변수를 올바르게 설정하는 것은 까다로울 수 있습니다. Windows에서 개발을 시작하려면 vmware player를 설치하고 Cloudera가 사전 구성된 가상 머신을 실행하는 것이 좋습니다. 이는 단순히 Windows 시스템을 재부팅하거나 재설치하지 않고 cygwin에서 설치 문제없이 Linux에서 Hadoop 개발을 수행한다는 의미입니다.

https://ccp.cloudera.com/display/SUPPORT/Cloudera%27s+Hadoop+Demo+VM

+0

링크가 오래되어 404 오류가 발생합니다. – Simulant

1

저는 오랫동안 야후 튜토리얼을 상대로 머리를 치고있었습니다. 이클립스 플러그인은 더 이상 유지 관리되지 않으며 매우 신뢰할 만하다. 다행히 cloudera 이미지가 트릭을 할 것입니다.

2

나는 완전히 hadoop에 새롭다. 솔직히 cloudera 튜토리얼과 정보는 전혀 도움이되지 않았다. IBM에게 기회를주세요, 그들은 매우 유용하며 초보자에게 매우 친숙합니다. 거의 모든 핵심 hadoop 애플리케이션에 대한 단계별 지침과 IBM의 배포판에 대한 특정 지침.

다운로드 링크가 있습니다. -

https://www14.software.ibm.com/webapp/iwm/web/preLogin.do?source=swg-ibmibqsevmw&S_TACT=109HF38W&S_CMP=109HF

당신은 계정을해야하지만, 그것은 무료이며 그렇게 오래 걸리지 않습니다.

지금은 하나 이상의 링크를 게시 할 수 없지만 온라인에서 쉽게 자습서를 찾을 수 있으며 VM 내에도 존재합니다.

또한 내가 붙어서 IBM의 누군가가 항상 1 시간에서 1 시간 만에 나를 도왔을 때 내 질문을 게시 한 포럼이 있습니다. Cant는 링크를 게시하지만 Google의 "IBM InfoSphere BigInsights Forum"은 첫 번째 히트입니다.

행운을 빌어 요!

0

방금 ​​"하둡 기초 I - 버전 2"를 http://bigdatauniversity.com에 작성했습니다. IBM BigBisunessInsight VMWare 이미지와 함께 제공되며 잘 작동합니다.

이미지에는 로컬 모드 1 및 클러스터 모드 1이 포함됩니다. 8GB RAM이 장착 된 Windows 8 워크 스테이션에서 다중 노드 클러스터를 시뮬레이트 할 수 있습니다.

희망 사항 :

관련 문제