2016-06-09 2 views
-4

데이터 프레임을 클러스터하려고하는데 dist 함수를 실행할 때 "강제로 도입 된 NAs"오류가 나타납니다.숫자 데이터 프레임에 강제 변환 오류가 발생했습니다.

Data Frame

하지만 난 그럼 그냥 숫자 값을 갖는 새 DF를 만들어 같은 오류가 있었다 : 내 DF 포함 된 요소 벡터 becuase 인 경우

Error message

은 처음에는 이렇게 생각 메시지 : 그래서

New DF

나는 내가 왜 확실하지 않다 이 오류 메시지가 표시되는 이유는 무엇입니까?

+1

[재현 가능한 예] (http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)를 제공 할 수 있습니까? 그리고 나는 png가 아닌 텍스트로 코드를 제공 할 것을 강력히 권장합니다. – Qaswed

+0

물론 다음 명령을 실행하고 있습니다 :'code' distance = dist (imputedTrainNoQuestions [, 2 : 5], method = "euclidean") NSA가없는 숫자 값만 포함하는 내 dafa 프레임의'code' – Gordon

+1

실제로 재현 할 수있는 코드를 제공하십시오. 만약 다른 누군가가'distput = dist (imputedTrainNoQuestions [, 2 : 5], method = "euclidean")'를 실행하면,'imputedTrainNoQuestions'이 작업 공간에 없기 때문에 오류가 발생합니다. 'dput (imputedTrainNoQuestions [sample (1 : 5568, size = 50),])'을 실행하고 그 결과를 png로 게시 할 수 있습니까? – Qaswed

답변

1

유클리드 거리 인자 데이터는 넌센스입니다.

놀랍지도 않습니다.

데이터를 숫자로 인코딩하면 오류가 사라지 겠지만 결과는 난센스가됩니다.

+0

글쎄, 오류를 없애고, 내 코드에 실수가 있었고 유클리드 거리를 사용하여 클러스터되었고 내 모델은 잘 작동합니다. – Gordon

+0

* 실행될 수 있지만 결과는 통계적으로 의미가 없습니다! 조심해! –

+0

로지스틱 회귀를 실행중인 데이터 세트를 클러스터링하는 데 사용하는 이유는 무엇입니까? – Gordon

관련 문제