치수가 m x n 인 행렬에서 PCA를 실행하려고합니다. 여기서 m은 피처 수이고 n은 샘플 수입니다.scikit-learn PCA를 사용하여 기능 감소 및 폐기 된 기능 알아보기
최대 분산으로 nf
기능을 보존한다고 가정합니다. scikit-learn
으로 나는이 방법으로 그것을 할 수 있어요 :
from sklearn.decomposition import PCA
nf = 100
pca = PCA(n_components=nf)
# X is the matrix transposed (n samples on the rows, m features on the columns)
pca.fit(X)
X_new = pca.transform(X)
지금, 나는 n 개의 X의 NF의 형상을 갖는 새로운 매트릭스 X_new
를 얻을. 어떤 기능이 삭제되었거나 유지 된 기능인지를 아는 것이 가능합니까?
감사
특징은 작은 크기에 투영하고 다양한 기능 사이의 흥미로운 연결을 나타 내기 위해 생각되어 삭제되지 않습니다. –
감사합니다. Tom, PCA를 기능 선택에 사용할 수 있다고 생각했지만 (잘못된 경우 올바르다) 주 구성 요소의 데이터를 다시 크기 조정하는 데만 사용됩니다. 그것을 읽으면서 나는 그 질문을 끝낼 것이라고 생각합니다. – gc5
출력 매트릭스의 모양은'(nf, n)'이 아니라'(n, nf)'이어야합니다. – eickenberg