으로 요약했습니다. 데이터에서 특이점을 식별하고 제거하기 위해이 스크립트를 발견했습니다. 이 코드를 사용하면 감지 된 특이 치를 제거할지 여부를 선택할 수 있습니다.이상한 점을 R
https://www.r-bloggers.com/identify-describe-plot-and-remove-the-outliers-from-the-dataset/
내가 뭘하고 싶은 것은 이상 값을 제거하지만, 복사하고, 그들과 함께 설정 다른 데이터를 생성 할 수 있습니다 : 여기의 코드에 대한 링크 및 기사합니다. 예를 들어, 내가 100 000 레코드의 데이터 세트를 가지고 있고이 스크립트에 의해 3500 개의 아웃 라이어가 발견되면, 3500 개의 레코드를 가져 와서 이들을 포함하는 전체 데이터 세트를 만들고 나중에 그에 대한 추가 분석을 할 수 있습니다. 원본 데이터 세트에서 삭제하지 않으려합니다.
할 방법이 있습니까? 고맙습니다!
는 예 :
이상 치는 감지 : 1 비율 : 20 %
var1 var2
a 15
b 1
c 2
d 1
e 3
는
알고리즘은 1
var1 var2
a 15
인가 그 행을 정렬의 아웃 라이어 및 디스플레이 뭔가를 인식
기타 등등. 스크립트는 그러나 이상 치를 포함하는 별도의 데이터 세트를 제공하지 않습니다. 어떻게해야합니까? 부디?
에 오신 것을 환영에 StackOverflow에. [MCVE] –
@ StevenBeaupré를 입력하십시오. 질문을 편집했습니다. 정보와 예제로 줄 수있는 것이 실제로 없기 때문에 이것이 충분하기를 바랍니다. –