2012-12-02 5 views
-4

가능한 중복으로 플로팅 :
PCA Analysis with PythonPCA 분석 및 파이썬

나는 그 크기에 1940 × 4 인이 data 있습니다. 그 행은 판독 값이나 샘플이며 열은 변수 (온도, 습도, 풍속 및 압력)입니다. 나는 PCA 분석을 수행하고 파이썬을 사용하여 그 결과를 그려보고 싶었다. 상황은, 몇 가지 기술과 예제로 끝났지 만, PCA 결과를 얻더라도 어떻게 활용하고 어떻게 해야할지 잘 모르겠습니다. 그래서 여기에서는 파이썬에서 PCA 분석을 구현할 수있는 방법을 찾고 있습니다. PCA 결과를 해석하는 방법과이를 그리는 방법을 이해하는 것뿐만 아니라 마지막으로 그 그림을 해석하는 방법을 이해해야합니다. 많은 감사.

+1

http://stackoverflow.com/questions/1730600/principal-component-analysis-in-python – YXD

+0

Mr E 님의 의견이 도움이됩니다. 또한 그것은 당신의 [이전 질문] (http://stackoverflow.com/questions/13224362/pca-analysis-with-python) 꽤 단단한 대답을 가지고있는 것 (그리고 나는이 질문이 어떻게 다른지 잘 모르겠다.) – gary

+0

이 예제를 보았습니다.이게 PCA 음모를 꾸미는 방법입니다. PCA 결과에 어떻게 음모를 꾸미고 제대로 해석해야하는지 알 필요가 있습니다. ( – khan

답변

0

주성분 분석은 데이터 집합의 차원을 줄이는 데 유용합니다. 귀하의 데이터에는 4 개의 변수 만 포함되어 있으므로 (내가 아는 한) 관련이 없으므로 PCA가 실용적인 분석에 유용 할 것으로 기대하지는 않습니다.

내가 틀렸고 일부 변수가 관련되어 있기를 진심으로 고려한다면 PCA를 사용하여 대부분의 일반적인 공분산을 포착하는 가장 중요한 4 벡터를 식별 할 수 있습니다. 이것들은 공분산 행렬의 고유 벡터입니다. 입력 변수와 동일한 공간을 완전히 차지하려면 4 개의 벡터가 필요합니다.

많은 변수가 측정되고 많은 양의 mutuual 정보가있는 시스템에서 PCA는 독립적 인 정보의 중요한 비트를 식별합니다. 나는 이것이 당신의 시스템의 경우라고 생각하지 않습니다.