2013-03-07 6 views
1

지금은 영화 평가를하고 모든 영화에 대한 지원을 계산하는 사용자 목록을 사용하는 프로그램을 만들고 있습니다. 내 프로그램에 계산하려는 영화의 최대 개수, 지원 최소 및 신뢰 최소값을 제공합니다.자바에서 지원에서 자신감을 계산하는 방법

현재 내 프로그램은 모두 하나의 영화에 대한 지원을 계산하고 지원 값을 파일로 지원 최소에 맞지 않는 인쇄합니다.

는 그 다음 최소한의 지원을 충족하고 또한 지원 최소 충족하고 새 파일에 이러한 통계를 인쇄 영화 쌍을 계산 하나의 영화에서 계속됩니다. 더 이상 영화 쌍/최소 지원 또는 도달되는 영화의 최대 수를 충족 세트가있을 때까지

이 계속됩니다.

동영상의 최대 수는 정수입니다. 예를 들어 3으로 설정하면 단일 영화, 영화 쌍 2, 영화 집합 3에 대한 지원을 계산하고 각각의 지원이있는 모든 단식, 쌍 및 세트를 각 파일로 다시 인쇄합니다.

내 출력 파일 중 하나의 예는 다음과 같습니다 ... 세 영화, 공간의 집합입니다

99 195 347,0.21314952279957583 
    99 343 347,0.24284199363732767 
    99 343 361,0.23329798515376457 
    99 347 361,0.23223753976670203 
    343 347 361,0.20254506892895016 

는 ","다음 지원 값에 따라 구분 된. 단일 동영상 및 동영상 쌍 파일은 똑같은 방식으로 표시되지만 쉼표 앞에는 1 (또는 2) 개의 동영상 ID 만 있습니다.

참고 : 나중에 영화 ID (번호)와 영화 이름을 매핑하여 매핑 할 수 있습니다.

내 질문 ... 내가 가지고있는 것과, 나에게 최소한의 신뢰 %를 충족하는 사람을 저장/가능한 모든 규칙과 인쇄의 신뢰를 계산에 대해 갈 수있는 방법은 무엇입니까?

답변

0

음, 무엇을 시도 했습니까?

도 APRIORI의 모든 인터넷을 통해 pseudocodes 및 구현의 수백이있다. 대부분의 사람들이 효율적으로 구현하지 못한 부분은 후보자 수를 최소로 유지하는 규칙입니다. 크기가 3 이상인 조합을 모두 시도하지 않으려 고합니다. 그것은 너무 오래 걸리고 모든 조합을 할 가치가 없습니다.

Apriori의 핵심은 다음 라운드의 후보자를 생성하고 잘라내는 것입니다.

한편 신뢰도 정의는 매우 간단합니다.

계산 규칙은 다음 설정 전체 항목 만 머리의 지원으로 신뢰를 계산한다. 분명히 이미 지원을하고 있으므로 신뢰도를 계산하는 것은 지원 가치에 대한 귀하의 DB에 대한 두 가지 조회가되어야합니다.

관련 문제