2017-11-19 1 views
0

필터를 사용하여 데이터 유형을 공칭으로 변경해야하는 경우는 언제입니까? 나는 지금 분류를하고 있는데, 그 결과를 그대로 명목상으로 변경하면 큰 차이가 있습니다. 미리 감사드립니다.공칭 필터의 숫자

답변

0

나는 당신의 질문이 잘 형성되어 있지 않지만 어쨌든 대답하려고 노력할 것입니다.

공칭 및 숫자 속성은 다양한 유형의 속성을 나타내므로 기계 학습 알고리즘에 따라 다르게 처리됩니다.

명목 속성은 닫힌 값 세트로 제한되며 이들 사이에는 순서 또는 다른 관계가 없습니다. 보통 공칭 속성에는 가능한 작은 값이 있어야합니다 (가능한 큰 값으로 설정하면 초과 피팅이 발생할 수 있음). 자동차의 색상은 공칭 속성으로 표시되는 속성의 예입니다.

일반적으로 숫자 속성이 더 일반적입니다. 이 값은 특정 축의 값을 나타내며 특정 값으로 제한되지 않습니다. 일반적으로 분류 알고리즘은 클래스간에 차별화되는 해당 축에서 점을 찾거나이 값을 사용하여 인스턴스 간 거리를 계산합니다. 직원의 급여는 아마도 숫자 속성으로 사용할 속성의 예입니다.

분류 알고리즘이 공칭 및 숫자 속성을 처리하는 방법을 고려해야 할 사항이 하나 더 있습니다. 일부 알고리즘은 명목상의 속성을 제대로 처리하지 못합니다. 속성의 값이 정규화되지 않은 경우 다른 알고리즘은 여러 숫자 속성에서 제대로 작동하지 않습니다.

관련 문제