2012-12-16 3 views
0

1 차원의 난수 세트가 주어지면 집합을 살펴보고 데이터를 트리 아래로 밀어 넣기 만하면됩니다. 한 차원에서 이것은 매우 간단합니다. 우리는 단순히 데이터의 가치를 비교하고 데이터가 트리 아래로 전파 될 위치를 결정할 수 있습니다.더 높은 차원의 데이터를위한 계층 적 트리 설계

그러나 더 높은 차원의 경우에는 거리가 흐려지기 시작하며 어떤 데이터를 트리 아래로 내려야할지 결정하기가 더 어렵습니다.

사실, 고차원 벡터 세트 (예 : 128 차원 SIFT 피쳐)를 포함하는 계층 트리를 디자인하려면 각 n 차원 벡터 중 어느 것이 어떤 하위 트리로 이동해야하는지 결정할 수 있어야합니다 에? 우리가하는 일에는 어떤 것들이 있습니까?

+0

트리가 아니라 계층 적 트리가 무엇입니까? –

+0

실제로 동일합니다. 나는 계층적인 부분을 강조하고 싶다. – Karl

+0

이 질문은 SIFT에만 국한된 것이 아니며 데이터가 계층 구조가 아니기 때문에 나무 만 다시 태그를 추가했습니다. –

답변

1

임의 나무

random tree 분류 또는 클러스터링을위한 일반적인 기법이다. 128 개 SIFT의 차원에서

  • (5처럼, 뭔가 작은) 임의의 K 선택 : 트리의 각 노드를 분할하는 방법을 결정하는 방법은 다음과

    입니다.

  • k 개의 차원 중 어느 것이 데이터의 최상의 분할을 제공하는지 결정합니다.

그래서 각 노드는 저장해야합니다

  1. 차원을
  2. 결정 임계 값을 사용하여 해당 차원에 적용 할

잎은 저장됩니다

  • 클래스 예측 또는 종료 된 데이터 포인트에 대한 통계 그 잎 노드에서
관련 문제