2014-12-14 2 views
0

내가 여기서 잘못하고있는 것이 확실하지 않지만 누군가 나를 도울 수 있기를 바랍니다. 내 모델로 k-means 클러스터링을 사용하여 빠른 광부에서 x 검증을 실행하려고합니다.신속한 광부에서 교차 유효성 검사를 통한 클러스터링

데이터 세트를 가져오고 하나의 속성에 'label'역할을 설정하고 데이터를 명목에서 숫자로 변환 한 다음 해당 출력을 x 유효성 검사 프로세스에 연결합니다. 그런 다음 교육 데이터를 k-means 클러스터링 모델에 연결하고 클러스터링 모델을 테스트 데이터 용 모델에 연결합니다. k-means 모델의 모델을 적용한 다음 성능 프로세스를 적용합니다.

'label'이라는 특수 속성이 필요하다는 오류가 계속 발생합니다.

여기 내가 틀린 부분을 잘 모르겠다. 어떤 도움도 받으실 수 있습니다.

주 과정 : main-process

X-검증 과정 : x-validation

오류 메시지 : error

답변

0

X-검증 레이블과 예측이 필요합니다. 클러스터링은 예측을 생성하지 않습니다. 다른 클러스터에 예제를 할당합니다. 할당 된 클러스터를 예측으로 변경하려면 Map Clustering on Labels 연산자를 사용할 수 있습니다. Apply ModelPerformance 운영자간에이 값을 입력하십시오.

클러스터 수가 유효한 레이블 값 수와 다른 경우 프로세스가 오류가 발생합니다.

0

유효성 검사에서 클러스터링을 확인하려면 부트 스트랩 프로 시저가 적합 할 수도 있습니다. 부트 스트랩 핑은 루프 및 샘플 운영자를 사용하여 쉽게 아카이브 될 수 있습니다. 첨부는 프로세스를 수행하는 것입니다.

클러스터링에서 매핑을 사용하여 레이블을 지정하면 유효성 검사에서 성능이 떨어집니다. 클러스터 된 예제를 원한다면 같은 트릭으로 X-Prediction을 사용할 수 있습니다.

<?xml version="1.0" encoding="UTF-8" standalone="no"?> 
<process version="6.1.001-SNAPSHOT"> 
    <context> 
    <input/> 
    <output/> 
    <macros/> 
    </context> 
    <operator activated="true" class="process" compatibility="6.1.001-SNAPSHOT" expanded="true" name="Process"> 
    <process expanded="true"> 
     <operator activated="true" class="retrieve" compatibility="6.1.001-SNAPSHOT" expanded="true" height="60" name="Retrieve Sonar" width="90" x="112" y="75"> 
     <parameter key="repository_entry" value="//Samples/data/Sonar"/> 
     </operator> 
     <operator activated="true" class="loop" compatibility="6.1.001-SNAPSHOT" expanded="true" height="76" name="Loop" width="90" x="313" y="75"> 
     <parameter key="iterations" value="10"/> 
     <process expanded="true"> 
      <operator activated="true" class="sample_bootstrapping" compatibility="6.1.001-SNAPSHOT" expanded="true" height="76" name="Sample (Bootstrapping)" width="90" x="179" y="30"/> 
      <operator activated="true" class="k_means" compatibility="6.1.001-SNAPSHOT" expanded="true" height="76" name="Clustering (2)" width="90" x="313" y="30"/> 
      <connect from_port="input 1" to_op="Sample (Bootstrapping)" to_port="example set input"/> 
      <connect from_op="Sample (Bootstrapping)" from_port="example set output" to_op="Clustering (2)" to_port="example set"/> 
      <connect from_op="Clustering (2)" from_port="cluster model" to_port="output 1"/> 
      <portSpacing port="source_input 1" spacing="0"/> 
      <portSpacing port="source_input 2" spacing="0"/> 
      <portSpacing port="sink_output 1" spacing="0"/> 
      <portSpacing port="sink_output 2" spacing="0"/> 
     </process> 
     </operator> 
     <connect from_op="Retrieve Sonar" from_port="output" to_op="Loop" to_port="input 1"/> 
     <connect from_op="Loop" from_port="output 1" to_port="result 1"/> 
     <portSpacing port="source_input 1" spacing="0"/> 
     <portSpacing port="sink_result 1" spacing="0"/> 
     <portSpacing port="sink_result 2" spacing="0"/> 
    </process> 
    </operator> 
</process> 
관련 문제