아이템 셋에 대한 적절한 최소 지원 및 자신감에 관한 어떤 종류의 자료를 제안 해주세요!itemset에 대한 적절한 최소 지원은 무엇입니까?
:: 나는 자주 항목 집합을 검색하기 위해 알고리즘을 사용합니다. 나는 여전히 아이템 셋에 대한 적절한지지와 확신을 모른다. 지원의 규모를 결정하는 데 필요한 고려 사항을 알고 싶습니다.
아이템 셋에 대한 적절한 최소 지원 및 자신감에 관한 어떤 종류의 자료를 제안 해주세요!itemset에 대한 적절한 최소 지원은 무엇입니까?
:: 나는 자주 항목 집합을 검색하기 위해 알고리즘을 사용합니다. 나는 여전히 아이템 셋에 대한 적절한지지와 확신을 모른다. 지원의 규모를 결정하는 데 필요한 고려 사항을 알고 싶습니다.
Apriori를 포함한 모든 연관 규칙 마이닝 알고리즘에서 사용자가 제공하려는 지원 및 신뢰도를 결정하는 것은 사용자가 결정합니다. 데이터 세트 및 목표에 따라 minSup 및 minConf를 결정하십시오. 분명히,이 값을 더 낮게 설정하면 알고리즘 실행 시간이 오래 걸리고 많은 결과를 얻을 수 있습니다.
최소 지원 및 최소 신뢰도 매개 변수는 사용자 환경 설정입니다. 통계적 신뢰도가 낮은 상태에서 더 많은 양의 결과를 원한다면 매개 변수를 적절히 선택하십시오. 이론적으로는 0으로 설정할 수 있습니다. 알고리즘은 실행되지만 시간이 오래 걸리고 결과는 특히 이 아닙니다.
결과가 필요에 맞게 선택하십시오. 수학적으로 모든 값은 "정확함"입니다.
대답은 적절한 값이 데이터에 따라 다릅니다.
일부 데이터 세트의 경우 최상의 값은 0.5 일 수 있습니다. 그러나 일부 다른 데이터 세트의 경우 0.05 일 수 있습니다. 그것은 데이터에 따라 다릅니다.
minsup = 0 및 minconf = 0으로 설정하면 종료되기 전에 일부 알고리즘의 메모리가 부족 해지거나 너무 많은 패턴이 있기 때문에 디스크 공간이 부족할 수 있습니다.
내 경험에 비추어 볼 때 minsup과 minconf를 선택하는 가장 좋은 방법은 높은 값으로 시작한 다음 충분한 패턴을 찾을 때까지 점차 낮추는 것입니다.
minsup을 설정하지 않으려면 top-k 알고리즘을 사용할 수 있습니다. 여기서 minsup을 지정하는 대신 가장 자주 k 개의 규칙을 지정하도록 지정합니다. 예를 들어, k = 1000 규칙. 당신이 최고 K 협회 규칙 마이닝에 의해 관심이 있다면
, 당신은 여기 내 자바 코드를 확인할 수 있습니다
http://www.philippe-fournier-viger.com/spmf/
알고리즘이라고합니다 TopKRules하고 다음 달에 게시됩니다 설명하는 문서를.
게다가, 당신은지지와 자신감 이외에 다른 흥미로운 조치가 있다는 것을 알아야합니다 : 들어 올림, 자신감, ... 이것에 대해 더 알고 싶다면이 기사를 읽으십시오 : "재미있는 측정 방법 선택 협회 규칙에 대한 흥미도 측정 조사 "기본적으로 모든 방법은 어떤 경우에는 몇 가지 문제가 있습니다 ... 완벽한 방법은 없습니다.
희망이 도움이됩니다.