2011-04-25 3 views
16

누군가 고차원 데이터를 시각화 할 수있는 좋은 방법이 있다면 알려주실 수 있습니까? 내 데이터는 현재 21 차원이지만 밀도가 높거나 희소한지 여부를보고 싶습니다. 이것을 달성하기위한 기술이 있습니까?고차원 데이터를 시각화 할 수있는 좋은 방법이 있습니까?

+2

답을 알 수는 없지만이 문제를 최적화하는 것이 매우 중요한 연구 주제라고 말할 수 있습니다. –

+0

Tableau 또는 Spotfire와 같은 시각화 도구를 사용하는 것이 좋습니다. 그럼에도 불구하고, 21 차원이 많이 있기 때문에 의미있는 수준으로 만들기 위해 일종의 차원 축소 기법을 수행해야 할 것입니다. http://www.tableausoftware.com/public –

답변

16

Parallel coordinates은 고차원 데이터를 시각화하는 데 널리 사용되는 방법입니다.

귀하의 데이터에 가장 적합한 시각화는 특성에 따라 달라집니다 - 서로 다른 차원이 얼마나 상관이 있습니까?

0

스타 스키마.

http://en.wikipedia.org/wiki/Star_schema

높은 차원 데이터 잘 작동.

팩트 테이블의 카디널리티가 차원 크기의 제품에 가까울 경우 데이터 밀도가 높습니다.

팩트 테이블의 카디널리티가 차원 크기의 곱보다 작 으면 스파 스 데이터가 있습니다.

중간에 판단 전화가 있습니다.

8

내가 검색 할 전문 용어는 multidimensional scaling입니다. 이는 전체 공간에서 가까운 점이 투영에 가까운 방식으로 높은 차원 공간에서 낮은 공간 (2 또는 3 차원)으로 투영을 개발하는 기술입니다.

종종 클러스터링 알고리즘의 출력을 시각화하는 데 사용됩니다 (예 : 클러스터가 MDS 프로젝션에서 압축되어 있어도 전체 공간에있을 가능성이 큽니다).

편집 : 데이터가 고밀도인지 또는 희소성인지를 결정하는 데 반드시 도움이되지는 않을 것입니다. 이는 투영법의 스케일을 잃어 버리기 때문에 그렇지만 그것이 균일하거나 덩어리인지 (아마도 그게 무슨 뜻인지) 알 수 있습니다.

0

데이터 탐색 소프트웨어는 고차원 데이터의 시각화를 위해 설계되었습니다. 데이터는 최대 13 개의 변수를 동시에 표시 할 수있는 3D 개체 모음 (각 데이터 그룹에 하나씩)으로 표시됩니다. 데이터 변수와 시각적 피쳐 간의 관계는 다른 기술 (예 : 평행 좌표)보다 훨씬 더 쉽게 기억할 수 있습니다.

2

나는 고차원 데이터를 시각화하는 방법을 찾고 있었고 효과적으로 사용 된 t-SNE technique이라는 것을 발견했습니다. 다른 사람들을 도울 수 있습니다.

+0

스팸 발견 – Cory

+0

무엇이 @Cory ? 이 질문은 내가 일하는 고차원 데이터의 좋은 시각화를 검색하려고 할 때 발견되었습니다. 연결된 SNE 페이지는 오픈 소스 소프트웨어로 다른 사람들에게 도움이 될 것이라고 생각했습니다. –

+0

미안하지만, 링크, 나는 그 페이지를 훑어 보았고 그것은 신용을 얻었지만, 나는 같은 빌드를 가진 무수한 스팸 게시물을 보았다. 내 부분에 혼란스러워서 죄송합니다. 게시물을 수정하여 투표 변경을 허용 할 수 있습니까? – Cory

관련 문제