2016-10-18 2 views
-1

으로 요약했습니다. 데이터에서 특이점을 식별하고 제거하기 위해이 스크립트를 발견했습니다. 이 코드를 사용하면 감지 된 특이 치를 제거할지 여부를 선택할 수 있습니다.이상한 점을 R

https://www.r-bloggers.com/identify-describe-plot-and-remove-the-outliers-from-the-dataset/

내가 뭘하고 싶은 것은 이상 값을 제거하지만, 복사하고, 그들과 함께 설정 다른 데이터를 생성 할 수 있습니다 : 여기의 코드에 대한 링크 및 기사합니다. 예를 들어, 내가 100 000 레코드의 데이터 세트를 가지고 있고이 스크립트에 의해 3500 개의 아웃 라이어가 발견되면, 3500 개의 레코드를 가져 와서 이들을 포함하는 전체 데이터 세트를 만들고 나중에 그에 대한 추가 분석을 할 수 있습니다. 원본 데이터 세트에서 삭제하지 않으려합니다.

할 방법이 있습니까? 고맙습니다!

는 예 :

이상 치는 감지 : 1 비율 : 20 %

var1 var2 
a  15  
b  1 
c  2 
d  1 
e  3 

알고리즘은 1

var1 var2 
a  15 

인가 그 행을 정렬의 아웃 라이어 및 디스플레이 뭔가를 인식

기타 등등. 스크립트는 그러나 이상 치를 포함하는 별도의 데이터 세트를 제공하지 않습니다. 어떻게해야합니까? 부디?

+2

에 오신 것을 환영에 StackOverflow에. [MCVE] –

+0

@ StevenBeaupré를 입력하십시오. 질문을 편집했습니다. 정보와 예제로 줄 수있는 것이 실제로 없기 때문에 이것이 충분하기를 바랍니다. –

답변

1

당신은 사용하여 이상 값을 얻을 수 있습니다 : boxplot.stats(x)$out

관련 문제