2014-11-13 2 views
1

2 개의 다른 시점에서 5 개의 장치를 측정했습니다. 측정 단위는 기본적으로 대응하는 위치에서의 비트 값에 대응하는 1과 0의 배열 구성논리 배열의 크기 축소

whos measurement1_dev1_time1 

Name       Size    Bytes Class  Attributes 

measurement1_dev1_time1  4096x8    32768 logical 

I는 시간 (1)과 측정 (2) 사이의 변화가 고유 특정 장치 것을 가정한다. 그러나 서로 다른 위치에서 32768 비트를 처리하기 때문에 어떤 종류의 종속성이 있는지 시각화하는 것은 매우 어렵습니다.

위치 x의 모든 비트가 관찰의 1 차원으로 간주 될 수 있으므로 치수의 수를 줄이기 위해 PCA를 사용하는 것으로 생각했습니다.

따라서, 5 개 디바이스의 모든 경우 :

  1. I 임의로 각각 따로
  2. 제가 pca() N * m와 컬럼 (m < 32768 입력으로 배열을 제조 n 포인트 t1에서 측정 및 t2 샘플 원래 데이터가 pca에 비해 너무 클 수 있음) 및 4 개의 행 (각 장치에 대해 하나의 행)으로 구성됩니다. 그러나 biplot(coeff(:,1:2), 'score', score(:,1:2))

:`[COEFF 잠재 성 점수 = PCA (zscore (A))``

  • 그럼 I 그것이 biplot를 이용하여 시각화하는 노력이 배열 A에서
  • 는 I는 PCA를 계산할 , 이것은 나에게 정말로 이상한 결과를 준다. 어쩌면 PCA가이 문제에 대한 올바른 접근법이 아닐까요? 또한 논리적 비트 배열 자체가 아닌 PCA를 수행하도록 입력 데이터를 수정했습니다. 대신 원래 측정 배열에 '1'이있는 인덱스를 포함하는 벡터를 만들었습니다. 또한 이상한 결과를 낳습니다.

    PCA에 완전히 익숙하지 않아서 프로세스의 결함을 보거나 PCA가 내 목표에 맞는 방법이 아닌지 물어보고 다른 차원 축소 접근법이나 클러스터링 알고리즘을 찾아 보는 것이 좋습니다.

  • +0

    를 속여 여기에 시도 할 수 있습니다 : http://datascience.stackexchange.com/ –

    +0

    덕분에, 나는 거기에 다시 게시됩니다! –

    +0

    5 개 또는 4 개의 기기? –

    답변

    1

    이 '일종의 종속성'은 데이터 포인트의 쌍 단위 상관 관계일까요? 또는 무엇을 찾고 싶습니까?

    meas_norm = 2*measurement1_dev1_time1 - 1; 
    
    CovarianceMatrix = meas_norm' * meas_norm; 
    
    figure 
    pcolor(CovarianceMatrix) 
    

    데이터 유형의 문제가있을 수 :

    당신은 당신이 할 경우 '예상 된 결과'를받을 수 있나요? double(data)을 먹이십시오. (예제에 적절한 코드를 입력하십시오)

    치수 감소를 찾으려면 ICA을 생각해보십시오.


    는 UPD : 당신은 xor 그것을 조사 할 수 있습니까? 당신이 행 또는 열에서 xor을 할 수 없어, 당신은 아마 all(x, dimension)

    example = imread('cameraman.tif')>128; 
    
    meas_points = numel(example); 
    num_sensors = 4; 
    
    %// simulate data for t1 
    meas_before = repmat(example(:), 1, num_sensors); 
    flickering_before = (rand(meas_points, num_sensors)<0.001); 
    meas_before(flickering_before) = ~meas_before(flickering_before); 
    
    %// simulate position of changing pixels, let's say 8% 
    true_change = (rand(num_sensors,1)<0.08); 
    
    %// simulate data for t2  
    meas_after = repmat(example(:), 1, num_sensors); 
    meas_after(true_change) = ~meas_after(true_chage); 
    flickering_after = (rand(meas_points, num_sensors)<0.001); 
    meas_after(flickering_after) = ~meas_after(flickering_after); 
    
    stable_points_after = all(meas_after, 2) | all(~meas_after, 2); 
    stable_point_fraction = sum(stable_points_after)./ meas_points; 
    
    %// similarly for the states before (i.e. t1) 
    stable_points_before = all(meas_before, 2) | all(~meas_before, 2); 
    
    %// now see which change coherently 
    stable_chage = meas_after(stable_points_after, 1) & meas_before(stable_points_before, 1) 
    
    +0

    예상되는 상관 관계는 다음과 같습니다. 특정 장치와 시간 t에서의 n 측정에서 개별 위치에서 비트의 90 % 이상이 n 측정에서 동일합니다 (따라서 10 %의 노이즈가 발생합니다. 비트 플립). 그러나 안정 비트의 위치와 그 바람직한 값 (0 또는 1)은 장치에 대해 개별적으로 t1에서 t2로 변경됩니다. 이 변경 사항의 고유성을 시각화하고 싶습니다. 그래서 CovarianceMatrix를 사용하는 코드는 내가 표현하고 싶은 것을 표현하지 않습니다. ICA를 살펴보고 코드를 추가하겠습니다. 고마워. –

    +0

    참조하십시오. 하나의 upvote는 5 가지의 가치가 있습니다. '감사합니다.') –

    +0

    내 데이터 포인트 간의 쌍 상관 관계로 무엇을 언급 하느냐에 따라 달라집니다. 실제로 예상되는 상관 관계는 항상 포인트 t1에서 측정의 i 번째 데이터 포인트와 i 사이에 있습니다 포인트 t2에서의 측정 값의 데이터 포인트. 그러나 모든 데이터 지점을 보면 t1과 t2 사이의 특성이 드러납니다.이 특성은 단일 장치에서만 고유합니다. –