2016-10-14 3 views
0

나는이 데이터 세트에서 찾고 있어요 :R- 리프트로 선착장 규정을 제한 할 수있는 방법이 있습니까?

ca.1<-read.csv("CreditApproval.csv",T,",") 

# From http://stackoverflow.com/q/4787332/ 
remove_outliers <- function(x, na.rm = TRUE, ...) { 
    qnt <- quantile(x, probs=c(.25, .75), na.rm = na.rm, ...) 
    H <- 1.5 * IQR(x, na.rm = na.rm) 
    y <- x 
    y[x < (qnt[1] - H)] <- NA 
    y[x > (qnt[2] + H)] <- NA 
    y 
} 

ca.1$A2<-remove_outliers(ca$A2) 
ca.1$A3<-remove_outliers(ca$A3) 
ca.1$A8<-remove_outliers(ca$A8) 
ca.1$A11<-remove_outliers(ca$A11) 
ca.1$A14<-remove_outliers(ca$A14) 
ca.1$A15<-remove_outliers(ca$A15) 
ca.1$A2<-discretize(ca.1$A2,"frequency",categories = 6) 
ca.1$A3<-discretize(ca.1$A3,"frequency",categories = 6) 
ca.1$A8<-discretize(ca.1$A8,"frequency",categories = 6) 
ca.1$A11<-discretize(ca.1$A11,"frequency",categories = 6) 
ca.1$A14<-discretize(ca.1$A14,"frequency",categories = 6) 
ca.1$A15<-discretize(ca.1$A15,"frequency",categories = 6) 

ca.1<-na.omit(ca.1) 

미세 조정 후 지원, 자신감, 분/난 아직도 얻고 MAXLEN 65 명 규칙 :

https://archive.ics.uci.edu/ml/machine-learning-databases/credit-screening/crx.data

나는 데이터를 전처리

> rules<-apriori(ca.1, parameter= list(supp=0.15, conf=0.89, minlen=3, maxlen=4), appearance=list(rhs=c("class=-", "class=+"), default="lhs")) 
> rules.sorted <- sort(rules, by="lift") 
> inspect(rules.sorted) 
    lhs      rhs  support confidence lift  
[1] {A5=g,A9=t,A10=t} => {class=+} 0.1521739 0.8974359 2.770607 
[2] {A4=u,A9=t,A10=t} => {class=+} 0.1521739 0.8974359 2.770607 
[3] {A1=a,A9=f}   => {class=-} 0.1717391 0.9753086 1.442579 
[4] {A1=a,A9=f,A13=g} => {class=-} 0.1608696 0.9736842 1.440176 
...[65] 

위에서 볼 수 있듯이 + 규칙은 - 규칙보다 규칙적이지만 지원 및 신뢰도는 낮습니다. 문서를보고 있었는데 리프트로 제한 할 수있는 매개 변수를 찾을 수 없습니다. 이것이 가능한가? 그렇지 않다면 이런 상황에서 무엇을합니까? 당신이 노력하면 어떻게

+0

찾고 계십니까? subrules <- subset (규칙, 올림> 임계 값) – MFR

+0

이 예제는 재현 할 수 없습니다. –

+0

@MFR Apriori 방법이 이것을 달성 할 수있는 방법을 제공하는지 궁금합니다. 나는 이것이 일반적인 문제가 아니라는 것을 의미합니까? –

답변

0

:

apriori(df, parameter = list(lift = 0.3, minlen =2)) 

당신은이 경우에 아무것도 최소 리프트를 설정할 수 있습니다, 그냥 0.3를 선택했다.

관련 문제