2012-12-06 2 views
0

나는 연관 규칙 마이닝을 위해 4547 x 5415 크기의 큰 바이너리 데이터 매트릭스로 작업하고 있습니다. 일반적으로 각 행은 모든 열이 항목 인 트랜잭션입니다. arules 패키지를 호출 할 때마다 트리오 라이브러리를 참조하는 일부 오류 메시지가 나타납니다. 누구든지 이런 유형의 오류 경험이 있습니까?Arules 패키지 - 트리오 오류

i[1:10,1:10] 
    101402 101403 101404 101405 101406 101411 101412 101413 101414 101415 
[1,]  0  0  0  1  0  0  1  0  0  0 
[2,]  0  1  0  0  0  0  1  0  0  0 
[3,]  0  0  0  0  0  0  1  0  0  0 
[4,]  0  0  0  1  0  0  0  0  0  1 
[5,]  0  0  0  1  0  0  0  0  0  1 
[6,]  0  1  0  0  0  1  0  0  0  0 
[7,]  0  0  0  0  0  0  1  0  0  0 
[8,]  0  0  1  0  0  0  0  0  0  1 
[9,]  0  0  0  0  0  1  0  0  0  0 
[10,]  0  0  0  0  1  0  1  0  0  0 



rules <- apriori(i, parameter=list(support=0.001, confidence=0.5)) 

    parameter specification: 
    confidence minval smax arem aval originalSupport support minlen maxlen target 
      0.5 0.1 1 none FALSE   TRUE 0.001  1  10 rules 
     ext 
    FALSE 

    algorithmic control: 
    filter tree heap memopt load sort verbose 
     0.1 TRUE TRUE FALSE TRUE 2 TRUE 

    apriori - find association rules with the apriori algorithm 
    version 4.21 (2004.05.09)  (c) 1996-2004 Christian Borgelt 
    set item appearances ...[0 item(s)] done [0.00s]. 
    set transactions ...[5415 item(s), 4547 transaction(s)] done [0.47s]. 
    sorting and recoding items ... [4908 item(s)] done [0.18s]. 
    creating transaction tree ... done [0.01s]. 
    **checking subsets of size 1 2Error in apriori(i, parameter = list(support = 0.001, confidence = 0.5)) : 
     internal error in trio library** 

재현 예 :

y <- matrix(nrow=4547, ncol=5415) 
y <- apply(y, c(1,2), function(x) sample(c(0,1),1)) 
rules <- apriori(y, parameter=list(support=0.001, confidence=0.5)) 
+0

, Epub 데이터 세트에서 arules 패키지를 테스트할까요? – agstudy

+0

Groceries 데이터 세트와 함께 해당 데이터 세트를 사용하여 작동합니다. – user1636475

+0

데이터를 재현 할 수 있습니까? – agstudy

답변

4

문제는 arules 패키지에서 에러 처리에 버그가 있다고한다. 메모리가 부족하여 apriori 코드가 적절한 오류 메시지를 만들려고하면 대신 Windows에서 트리오 라이브러리에 의해 처리되는 printf에 대한 잘못된 호출이 생성됩니다. 즉, 메모리 부족 오류가 발생합니다.

이 문제는 arules 버전 1.1-4에서 해결 될 것입니다.

당신이 지원을 증가 및/또는 (매개 변수 목록에 maxlen을)를 itemsets의 항목 수를 제한해야 메모리 부족 방지하기 위해

-Michael 데이터없이

디버깅하기 어려운
관련 문제