2012-10-10 2 views
2

저는 현재 Hadoop에서 결정 트리 (PLANET이라고도 함)를 구현하기위한 Google의 프레임 워크를 구현했습니다. 트리가 완전히 빌드 될 때까지 하나의 버텍스부터 시작하여 점점 더 추가하는 맵 축소 작업으로 시작됩니다. 하나의 큰 문제는지도/삭감 작업이 많이 차례로 진행된다는 사실입니다. 따라서 항상 새로운 작업을 시작하는 데 드는 비용은 매우 높습니다.아파치 하마는 의사 결정 트리를 만드는 데 적합합니까?

아파치 하마가 그래프와 같은 반복 알고리즘에 적합하다는 것을 여러 번 보았습니다. 누군가 하마와 함께 새로운 그래프를 만들 수 있습니까? 아니면 그래프로 입력을 받아 계산을 할 수 있습니까? 내 프로젝트를 하마에게 전송하는 것이 쉬운가요 ?? 감사합니다

+3

안녕하세요, 저는 하마 팀 출신입니다. 기계 학습 모듈에 적합 할 수 있으므로 그런 식으로 제작할 수 있도록 도와 드리겠습니다. hama-dev 메일 링리스트로 가서 질문을 다시 해보시겠습니까? (http://hama.apache.org/mail-lists.html). 그래프 모듈은 내 생각에 그렇게 적합하지 않습니다. –

+1

하지만 하마가 당신에게 덜 흥미로울 수 있도록, 하마는 이것을 매우 효율적으로 할 수 있습니다. 나는 이것을 나의 로드맵에 가지고 있었다. 그러나 나는 그것에 깊이 관여 할 수 없었다. –

+0

나는 당신의 게시물을 여러 번 보았습니다. 토마스와 사실 나는 당신에게서 하마를 배웠습니다 : P. 내가 말한대로 목록에 보냅니다 – jojoba

답변

2

하마는 MapReduce보다 훨씬 효율적인 방법으로 PLANET 논문에 설명 된 알고리즘을 사용하여 실제로 의사 결정 트리를 구성 할 수 있습니다.

하마는 그래프를 입력 할 필요가 없으므로 일반적으로 원시 기능 벡터를 HDFS에서 직접 입력으로 처리하는 Hama ML (기계 학습) 모듈을 살펴볼 수 있습니다.

하마에게이 알고리즘의 진행 상황을 추적하기 위해 new issue in the Apache Jira을 생성했습니다.

+0

답변으로 "감사합니다"를 추가하지 마십시오. 대신 도움이되는 답변에 투표하십시오. – JBCP

+0

@JBCP 당신은 대답 경찰입니까? 나 자신의 답변을 upvote 수 없다, 당신은 당신의 로봇을 업데이 트해야합니다 : p –

+1

이것은 질문에 대한 답변을 제공하지 않습니다. 비평하거나 저자의 설명을 요청하려면 게시물 아래에 의견을 남겨 둡니다. – showdev

관련 문제