2014-10-28 2 views
-4

나는 예측 변수의 14 개 열과 솔루션 변수 (y)의 1 개 열을 포함하는 데이터를 가지고 있습니다. R에서 데이터를 정규화하고 비정규 화하는 방법은 무엇입니까?

나는 정상화와 주셔서 감사합니다

R.

의 데이터를 비정규 어떤 붙박이 기능이 있는지 알고 싶었다. normDataWithin 패키지

+1

광범위한 잠재 고객에게 더 설명 할 수 있습니까? 재현 할 수있는 예제를 제공합니까? 'reshape' 함수 나 Hadley Wickham이 널리 사용되는'reshape2' 및/또는'tidyr' 패키지를 찾고있을 수도 있습니다. –

답변

0

Rmisc는 {}을 사용할 수있다 : http://www.inside-r.org/packages/cran/Rmisc/docs/normDataWithin

그밖에 다음과 같은 방법이 사용될 수있다 :

(가변 평균값)/SD. LOG2,

mydata$myNormalizedVar<-(mydata$myvar-mean(mydata$myvar))/sd(myvar) 

로그 (LOG10), 및 제곱근 (SQRT)

정상 분위수 정상화 또는 정상 분위수 변환 : 다음 코드는 data.frame 사용할 수 있습니다. 시도해보십시오.

quantNorm = function(x){qnorm(rank(x,ties.method = "average")/(length(x)+1))} 
hist(quantNorm(1:10000),100) 
관련 문제