2011-07-18 4 views
0

아이템 셋에 대한 적절한 최소 지원 및 자신감에 관한 어떤 종류의 자료를 제안 해주세요!itemset에 대한 적절한 최소 지원은 무엇입니까?

:: 나는 자주 항목 집합을 검색하기 위해 알고리즘을 사용합니다. 나는 여전히 아이템 셋에 대한 적절한지지와 확신을 모른다. 지원의 규모를 결정하는 데 필요한 고려 사항을 알고 싶습니다.

답변

0

Apriori를 포함한 모든 연관 규칙 마이닝 알고리즘에서 사용자가 제공하려는 지원 및 신뢰도를 결정하는 것은 사용자가 결정합니다. 데이터 세트 및 목표에 따라 minSup 및 minConf를 결정하십시오. 분명히,이 값을 더 낮게 설정하면 알고리즘 실행 시간이 오래 걸리고 많은 결과를 얻을 수 있습니다.

0

최소 지원 및 최소 신뢰도 매개 변수는 사용자 환경 설정입니다. 통계적 신뢰도가 낮은 상태에서 더 많은 양의 결과를 원한다면 매개 변수를 적절히 선택하십시오. 이론적으로는 0으로 설정할 수 있습니다. 알고리즘은 실행되지만 시간이 오래 걸리고 결과는 특히 이 아닙니다.

결과가 필요에 맞게 선택하십시오. 수학적으로 모든 값은 "정확함"입니다.

2

대답은 적절한 값이 데이터에 따라 다릅니다.

일부 데이터 세트의 경우 최상의 값은 0.5 일 수 있습니다. 그러나 일부 다른 데이터 세트의 경우 0.05 일 수 있습니다. 그것은 데이터에 따라 다릅니다.

minsup = 0 및 minconf = 0으로 설정하면 종료되기 전에 일부 알고리즘의 메모리가 부족 해지거나 너무 많은 패턴이 있기 때문에 디스크 공간이 부족할 수 있습니다.

내 경험에 비추어 볼 때 minsup과 minconf를 선택하는 가장 좋은 방법은 높은 값으로 시작한 다음 충분한 패턴을 찾을 때까지 점차 낮추는 것입니다.

minsup을 설정하지 않으려면 top-k 알고리즘을 사용할 수 있습니다. 여기서 minsup을 지정하는 대신 가장 자주 k 개의 규칙을 지정하도록 지정합니다. 예를 들어, k = 1000 규칙. 당신이 최고 K 협회 규칙 마이닝에 의해 관심이 있다면

, 당신은 여기 내 자바 코드를 확인할 수 있습니다

http://www.philippe-fournier-viger.com/spmf/

알고리즘이라고합니다 TopKRules하고 다음 달에 게시됩니다 설명하는 문서를.

게다가, 당신은지지와 자신감 이외에 다른 흥미로운 조치가 있다는 것을 알아야합니다 : 들어 올림, 자신감, ... 이것에 대해 더 알고 싶다면이 기사를 읽으십시오 : "재미있는 측정 방법 선택 협회 규칙에 대한 흥미도 측정 조사 "기본적으로 모든 방법은 어떤 경우에는 몇 가지 문제가 있습니다 ... 완벽한 방법은 없습니다.

희망이 도움이됩니다.

관련 문제