2009-12-25 5 views

각 클러스터에는 x, y (좌표) 및 유형 (1 클래스 1,2 클래스 2)을 알 수있는 값이있는 두 개의 클러스터 데이터가 있습니다.이 데이터를 플로팅했지만 이 클래스들을 경계 (시각적으로)로 나누는 것을 좋아합니다. 그런 일을하는 기능은 무엇입니까? 나는 윤곽선을 시험해 보았다. 그러나 도움이되지 않았다!matlab에서 데이터를 두 클래스로 나누기

points scatter plot

당신은 당신이 미리 경계의 방정식을 알고있는 쉽게 분리 클러스터를 제외하고 볼 수 있듯이, 경계를 찾는 것은 아니다 :



합니다 (이 Iris dataset 사용)이 classification 문제를 고려 간단한 작업은 ...

하나의 아이디어 경계를 (당신은 선형 및 차 경계 사이에 선택의 여지가) 찾기 위해 discriminant analysis 기능 classify을 사용하는 것입니다.

다음은 절차를 설명하기위한 전체 예제입니다. 이 코드는 통계 도구 상자가 필요합니다

%# load Iris dataset (make it binary-class with 2 features) 
load fisheriris 
data = meas(:,1:2); 
labels = species; 
labels(~strcmp(labels,'versicolor')) = {'non-versicolor'}; 

NUM_K = numel(unique(labels));  %# number of classes 
numInst = size(data,1);    %# number of instances 

%# visualize data 
gscatter(data(:,1), data(:,2), labels, 'rb', '*o', ... 
    10, 'on', 'sepal length', 'sepal width') 
title('Iris dataset'), box on, axis tight 

%# params 
classifierType = 'quadratic';  %# 'quadratic', 'linear' 
npoints = 100; 
clrLite = [1 0.6 0.6 ; 0.6 1 0.6 ; 0.6 0.6 1]; 
clrDark = [0.7 0 0 ; 0 0.7 0 ; 0 0 0.7]; 

%# discriminant analysis 
%# classify the grid space of these two dimensions 
mn = min(data); mx = max(data); 
[X,Y] = meshgrid(linspace(mn(1),mx(1),npoints) , linspace(mn(2),mx(2),npoints)); 
X = X(:); Y = Y(:); 
[C,err,P,logp,coeff] = classify([X Y], data, labels, classifierType); 

%# find incorrectly classified training data 
[CPred,err] = classify(data, data, labels, classifierType); 
bad = ~strcmp(CPred,labels); 

%# plot grid classification color-coded 
figure(2), hold on 
image(X, Y, reshape(grp2idx(C),npoints,npoints)) 
axis xy, colormap(clrLite) 

%# plot data points (correctly and incorrectly classified) 
gscatter(data(:,1), data(:,2), labels, clrDark, '.', 20, 'on'); 

%# mark incorrectly classified data 
plot(data(bad,1), data(bad,2), 'kx', 'MarkerSize',10) 
axis([mn(1) mx(1) mn(2) mx(2)]) 

%# draw decision boundaries between pairs of clusters 
for i=1:NUM_K 
    for j=i+1:NUM_K 
     if strcmp(coeff(i,j).type, 'quadratic') 
      K = coeff(i,j).const; 
      L = coeff(i,j).linear; 
      Q = coeff(i,j).quadratic; 
      f = sprintf('0 = %g + %g*x + %g*y + %g*x^2 + %g*x.*y + %g*y.^2',... 
      K = coeff(i,j).const; 
      L = coeff(i,j).linear; 
      f = sprintf('0 = %g + %g*x + %g*y', K,L(1),L(2)); 
     h2 = ezplot(f, [mn(1) mx(1) mn(2) mx(2)]); 
     set(h2, 'Color','k', 'LineWidth',2) 

xlabel('sepal length'), ylabel('sepal width') 
title(sprintf('accuracy = %.2f%%', 100*(1-sum(bad)/numInst))) 

hold off 

classification boundaries with quadratic discriminant function


일을 .... 꽤! – Jacob


@Amro - 나만인가, 아니면 두 번째 스크린 샷이 누락 되었습니까? – Shai


@Shai : 당신뿐만 아니라 때때로 imageshack에 업로드 된 오래된 이미지가 어떤 이유로 사라지는 경향이 있습니다 ... 어쨌든 신선한 이미지로 예제를 업데이트했습니다 :) – Amro

관련 문제