2013-07-25 5 views
0

나는 여기 carrot2를 처음 사용하므로 나와 함께하시기 바랍니다. Aduro 클러스터 맵을 사용하기 위해 carrot2workbench 32 비트를 사용하고 있습니다. 클러스터 간의 관계를 확인하는 것이 도움이되지만 집합간에 겹치는 부분 (병합 된 버블)을 식별하는 방법은 무엇입니까? 예를 들어 한 클러스터에 20 개의 문서와 30 개의 문서가 있고 5 개의 문서가 중복되는 경우이 5 개의 문서가 무엇인지 알아내는 방법은 무엇입니까? 나는 그렇게 할 수있는 옵션을 찾지 못했습니다. 그렇게 할 수 없으면 매우 유용 할 수 없습니다. 도와주세요. 대단히 감사합니다!병합 병합 된 문서 확인

답변

0

아쉽게도 이것은 Carrot2 Workbench의 현재 알려진 제한 사항입니다. 다양한 이유로 Aduna 시각화와 나머지 Workbench 간의 상호 작용이 제한되어 있으므로 둘 이상의 클러스터에서 공유하는 문서를 검사 할 수 없습니다.

우리는 Aduna를 유사한 기능의 다른 시각화로 대체하려고합니다. 이러한 이유로 우리는 전체 상호 작용을 가능하게하기 위해 Aduna를 해킹 할 계획이 아닙니다.

Aduna 시각화의 일부 오래된 바이너리는 Maven 저장소에서 사용할 수 있습니다. 따라서 Carrot2 클러스터링과 함께 놀고 싶다면 필요한 모든 리소스가 있습니다.

+0

감사합니다. 지금이 시점에서 할 수없는 클러스터를 내보내는 중입니까? 선택된 클러스터를 C2로 다시 공급하여 추가 클러스터링을 수행합니다 (검색 탭의 옵션이지만 그렇게하기 위해 클러스터를 내보내는 방법이 없습니다.) 감사합니다. – user2599757

+0

파일 -> 다른 이름으로 저장을 참조하십시오. ... 메뉴 옵션. –

+0

하지만 그 문서 ID, 클러스터링을 위해 업로드 한 XML의 추상 인용문 집합 전체가 아닙니다. 선택한 형식으로 피드 할 수 있도록 같은 형식으로 클러스터를 가져 오려고했습니다. 다시 클러스터링을 위해 다시 – user2599757