1
수백만 개의 노드가있는 의사 결정 트리를 HDFS에 직렬화했습니다. 지도를 사용하여 Hadoop에서 검색을보다 효율적으로 수행 할 수 있도록 더 나은 직렬화를 수행하는 방법을 알려주는 포인터를 알려주십시오.mapreduce를 사용하여 의사 결정 트리 조회를 수행하는 방법은 무엇입니까? 최적화 된 버전을 찾고 있는데
감사합니다.
수백만 개의 노드가있는 의사 결정 트리를 HDFS에 직렬화했습니다. 지도를 사용하여 Hadoop에서 검색을보다 효율적으로 수행 할 수 있도록 더 나은 직렬화를 수행하는 방법을 알려주는 포인터를 알려주십시오.mapreduce를 사용하여 의사 결정 트리 조회를 수행하는 방법은 무엇입니까? 최적화 된 버전을 찾고 있는데
감사합니다.
나무를 탐색하려면 모델을 메모리에로드해야합니다. 로드 된 후에는 인스턴스 탐색을 매우 쉽고 빠르게 수행 할 수 있습니다. 모델을 hdfs에 저장하는 것을 피할 수 없으므로 더 나은 트래버스를 수행하려면 주 메모리에서 더 나은 작업을 수행해야합니다. 그러나 내가 말했듯이 나무 횡단은 항상 초고속입니다. 아마도 당신의 문제에 대한 더 많은 정보를 제공하는 것이 좋을 것입니다. 수백만 가지의 새로운 예가 있고 라벨을 예측하는 데 문제가 있습니까?