1

현재 내가 직면 한 문제에 대한 제안을 찾고 있습니다.센서 네트워크의 SVM에 대한 치수 감소

나는 어떤 이벤트 E1-E20이 수행 될 때 트리거되는 S1-S100 센서 세트를 가지고 있습니다. E1은 일반적으로 S1-S20을 트리거하고, E2는 S15-S30을 트리거하고, E3 트리거는 S20-s50 등을, E1-E20은 완전히 독립적 인 이벤트라고 가정합니다. 때로는 이벤트 E가 관련없는 다른 센서를 트리거 할 수 있습니다.

각 이벤트를 별도로 분석하기 위해 20svm의 앙상블을 사용하고 있습니다. 내 기능은 센서 주파수 F1 - F100, 각 센서가 트리거 된 횟수 및 기타 관련 기능입니다.

센서 기능 (F1-F100) 또는 모든 센서를 감추고 치수를 줄이는 기술을 줄이려는 기술을 찾고 있습니다. (저는 마지막으로 몇 가지 정보 이론 개념을 찾고있었습니다. 며칠). 나는 평균화를 생각하지 않는다. 정보를 잃을 위험이 있기 때문에 최대화는 좋은 생각이다 (좋은 결과를주지 못했다).

누군가 제발 내가 여기에없는 것을 제안 할 수 있습니까? 종이 또는 시작 아이디어 ...

미리 감사드립니다.

답변

2

아마 Linear Discriminant Analysis으로 시작하는 것이 좋을 것입니다. 이것은 매우 간단한 알고리즘이며, 원하는 것보다 다소 적습니다 : 차원 감소 및/또는 분류. 그것은 각 클래스가 서로 다른 평균을 가지고 분포 된 가우스 분포이지만 동일한 공분산을 가정합니다. 이 가정이 합리적인지 확인하기 위해 사전에 일부 데이터를 플롯하는 것이 좋습니다. 이전에 R에서 LDA 구현을 사용했습니다. 그러나 이것은 약 12 ​​가지 특징을 가지고있었습니다. 나는 그것이 어떻게 100 차원으로 확장 될지 모르겠습니다.

왜 데이터 크기를 줄이려고하는지 알 수 있습니다. SVM은 수십만 개의 (희소 한) 기능과 함께 일반적으로 사용되므로 어려움은 무엇입니까?

+0

덕분에 .. 난 .. LDA을 다할 것입니다 내가 E1은 S1-S15, 센서 주파수 F16-F100의 나머지 부분에 대한 값을 유발하는 경우 때문에 대부분의 경우 크기를 감소 할 것이다 제로 가끔, 다른 센서가 S45, S50이 몇 번 트리거 될 수 있다고 말합니다 ... 주로 특징 벡터 – iinception

+0

에서 모든 제로를 제외하고 싶습니다. LDA는 관련이 있지만 매우 다른 알고리즘입니다. – Stompchicken