1

데이터 크기가 50x100000입니다. (100000 개의 피쳐, 각 피치는 50입니다).가우시안 혼합물 모델 확률 matlab

이 데이터를 사용하여 가우스 혼합 모델에 적합하겠습니다. 다음 코드를 사용했습니다. $의 \ 세타 $가 gaussing 혼합 모델 매개 변수입니다 $, | 내가 가능성을 얻을 수 있어야 새로운 데이터 Y에 $ P (\ 세타 Y)를 확률 줄 때 내가 필요로 무엇

   obj = gmdistribution.fit(X',3); 

이다.

확률 값을 얻기 위해 다음 코드를 사용했습니다.

   P = pdf(obj,X'); 

그러나 나는 매우 낮은 값을 얻고 있습니다. 어떻게하면 적절한 확률 값을 얻을 수 있습니까?

+0

데이터가 50x100000 크기라고하면, 길이가 50 인 100000 개의 벡터가 있고 다 변수 정규 분포의 혼합을 찾고 있음을 의미합니까? 즉, 혼합 분포의 각 분포는 다 변수 길이 50의 벡터에 대한 정규 분포? – Stochastically

+0

네 맞습니다. – user570593

답변

4

가우스 분포의 pdf의 최대 값은 1/sqrt (2 * PI)입니다. 따라서 50 차원에서 최대 값은 1/(sqrt (2 * PI)^50)로 1E-20 정도가 될 것입니다. 따라서 pdf의 값은 모두 그 크기보다 작거나 작을 것입니다.

+0

답장을 보내 주셔서 감사합니다. 여기 PI가 뭐지? 나는 확률 값으로부터 이상 치를 거부하는 분류자를 만들 계획이다. 나는 한 종류의 데이터에 기초하여이 분포를 배우고있다. 필자의 경우 어떻게 확률 값을 기반으로 분류자를 만들 수 있습니까? – user570593

+0

PI는 3.14159입니다. sqrt는 제곱근 함수입니다. 나는 아마도 당신의 원래 질문에 대답했을 것이라고 생각합니다. 그래서 동의한다면,이 대답을 유용하거나 받아 들일 수 있다고 생각할 수도 있습니다. 분류자를 만드는 방법과 관련된 또 다른 질문을 올린다면 가능한 한 새로운 모양을하고 답변을 게시 할 것입니다. 참고로, 나는 항상 '확률'태그가있는 모든 질문을 살펴 본다. – Stochastically

+0

답장을 보내 주셔서 감사합니다. 회신을 찾고 http://stackoverflow.com/questions/17113387/outlier-detection-based-on-gaussian-mixture-model에 새로운 질문을 게시했습니다. :-) – user570593