2010-06-16 3 views

답변

16

연관 규칙은 A와 B가 발생할 때 C가 발생하는 경향이 있음을 의미하는 "A, B → C"와 유사합니다. 항목 세트는 "A, B, C"와 같은 모음 일 뿐이며 항목이 동시에 발생하는 경향이있는 경우 빈번합니다. The usual way은 연결 규칙을 찾기 위해 모든 빈 항목 집합을 찾아 규칙으로 후 처리하는 것입니다.

8

빈번한 항목 집합 마이닝의 입력은 :

  • 트랜잭션 데이터베이스
  • 최소 지원 임계 minsup

출력은 :

  • 모두의 집합 최소한 분에 표시된 항목 집합 거래입니다. 항목 집합은 순서가 지정되지 않은 항목 집합입니다.

assocition 규칙 마이닝의 입력은 다음과 같습니다

  • 트랜잭션 데이터베이스
  • 최소 지원 문턱 minsup
  • 최소 신뢰 임계 값 minconf

출력은 다음과 같습니다.

  • 모든 유효한 연결 규칙 집합입니다. 연관 규칙 X -> Y는 두 개의 항목 집합 X와 Y 사이의 관계이므로 X와 Y는 서로 겹치지 않으며 비어 있지 않습니다. 유효한 규칙은 minsup보다 높거나 같은 지원과 minconf보다 크거나 같은 신뢰를 갖는 규칙입니다. 지원은 sup (x -> Y) = sup (X U Y)/(거래 수)로 정의됩니다. 신뢰는 conf (x -> Y) = sup (X U Y)/sup (X)로 정의됩니다.

이제 항목 집합과 연결 규칙 마이닝 간의 관계는이 아이디어에 대한 자세한 내용을 보려면 규칙 집합을 생성하는 데 자주 항목 집합을 사용하는 것이 매우 효율적이라는 것입니다 (Agrawal 1993 년 논문 참조). 따라서 연관 규칙 마이닝은 두 단계로 나뉩니다. - 빈 항목 집합 마이닝 - 빈 항목 집합을 사용하여 모든 유효한 연결 규칙을 생성합니다.

1

자주 항목 집합 마이닝은 연결 규칙 마이닝의 단계입니다. Apriori, FPGrowth와 같은 자주 항목 집합 마이닝 알고리즘을 데이터에 적용한 후에는 자주 항목 집합을 가져옵니다.이 에서 자주 항목 집합을 발견 했으므로 연관 규칙을 생성합니다 (보통 하위 집합 생성으로 완료).

4

자주 사용되는 항목 집합 마이닝은 연결 규칙 마이닝의 첫 번째 단계입니다. 모든 빈번 항목 집합을 생성 한 후에는 가능한 모든 연관 규칙을 열거하고 하나씩 차례로 반복하여 자신감을 계산하고 마지막으로 신뢰도가>minConfidence이면 해당 규칙을 출력합니다.

관련 문제