2010-04-29 4 views
5

Windows에서 실행되는 응용 프로그램에서 Mahout을 사용하려고합니다. 나는 k-means를 사용하여 lucene 인덱스로부터 클러스터를 만들고 싶습니다.Windows 환경에서 Mahout을 사용하는 방법은 무엇입니까?

Hadoop이 Windows 환경에서 알 수없는 프로그램 (예 : chmod)에 명령 줄 호출을하므로 Hadoop-Exception이 발생하는 즉시 시퀀스 파일 (lucene 색인에서 벡터 만들기)을 만들어야합니다. Cygwin에서 실행하는 것은 옵션이 아닙니다. 이후 Eclipse에서 App을 실행할 수 있기를 원합니다.

내 질문은

  • 이 방법은 lucene 색인에서 내 벡터를 검색하는 시퀀스 파일을 만들 필요가 피할 수있는 방법은 무엇입니까?
  • 또는 Windows 환경에서 시퀀스 파일을 만드는 방법이 있습니까?
  • 답변

    4

    Windows 환경에서 Hadoop을 실행할 수있는 유일한 방법은 Cygwin을 설치하는 것입니다. 더 많은 정보를 원하시면,이 블로그 게시물을 참조 :

    http://hayesdavis.net/2008/06/14/running-hadoop-on-windows/

    Cygwin에서이 하둡에 의존 (chmod를 같은) 모든 명령 줄 유틸리티를 제공합니다. 원하는 경우 Eclipse 내에서 Hadoop 작업을 실행할 수 있습니다.

    +0

    둘째로, 이것은 Hadoop에 관한 질문이며 Windows에서는 Hadoop을 실행할 수 없습니다. –

    +0

    HDInsight는 Windows Azure 용 Hadoop 구현입니다. 클라우드가 아닌 로컬 시스템에서 사용하려면 Web Platform Installer로 설치할 수있는 HDInsight 에뮬레이터를 사용해보십시오. – user888734

    +0

    이제 Windows에서 Hadop (https://wiki.apache.org/hadoop/Hadoop2OnWindows)을 사용할 수 있으므로 답변을 업데이트하고 싶을 수도 있습니다. 나는 기꺼이 대답 하겠지만, 나는 여전히 Mahout을 사용할 방법을 찾고있다 :) – fxm

    1

    SequenceFile API를 알고 계십니까? 여기를보십시오 : http://hadoop.apache.org/common/docs/current/api/org/apache/hadoop/io/SequenceFile.html 직접 작성/읽기를 시도 할 수 있습니다.

    저는 Windowns의 Eclipse에서 독립형 모드로 Mahout을 실행할 수 있다고 생각합니다. 그러나 몇 가지 짧은 순간과 장벽이 나타날 것입니다. 당신이 얼마나 멀리 왔는지 시도해야합니다.

    내 의견으로는 이클립스에서 마호 마트를 달리라고 주장해서는 안됩니다. ;-)

    0

    가상 머신을 사용하여 Hadoop 환경을 실행할 수 있습니다. 나를 위해 최선의 해결책은 http://hortonworks.com/ 프로젝트를 사용하는 것입니다. 모든 것이 잘 작동합니다.

    관련 문제