누군가 고차원 데이터를 시각화 할 수있는 좋은 방법이 있다면 알려주실 수 있습니까? 내 데이터는 현재 21 차원이지만 밀도가 높거나 희소한지 여부를보고 싶습니다. 이것을 달성하기위한 기술이 있습니까?고차원 데이터를 시각화 할 수있는 좋은 방법이 있습니까?
답변
Principal component analysis은 크기가 상관되는 경우 유용 할 수 있습니다.
Parallel coordinates은 고차원 데이터를 시각화하는 데 널리 사용되는 방법입니다.
귀하의 데이터에 가장 적합한 시각화는 특성에 따라 달라집니다 - 서로 다른 차원이 얼마나 상관이 있습니까?
스타 스키마.
http://en.wikipedia.org/wiki/Star_schema
높은 차원 데이터 잘 작동.
팩트 테이블의 카디널리티가 차원 크기의 제품에 가까울 경우 데이터 밀도가 높습니다.
팩트 테이블의 카디널리티가 차원 크기의 곱보다 작 으면 스파 스 데이터가 있습니다.
중간에 판단 전화가 있습니다.
내가 검색 할 전문 용어는 multidimensional scaling입니다. 이는 전체 공간에서 가까운 점이 투영에 가까운 방식으로 높은 차원 공간에서 낮은 공간 (2 또는 3 차원)으로 투영을 개발하는 기술입니다.
종종 클러스터링 알고리즘의 출력을 시각화하는 데 사용됩니다 (예 : 클러스터가 MDS 프로젝션에서 압축되어 있어도 전체 공간에있을 가능성이 큽니다).
편집 : 데이터가 고밀도인지 또는 희소성인지를 결정하는 데 반드시 도움이되지는 않을 것입니다. 이는 투영법의 스케일을 잃어 버리기 때문에 그렇지만 그것이 균일하거나 덩어리인지 (아마도 그게 무슨 뜻인지) 알 수 있습니다.
데이터 탐색 소프트웨어는 고차원 데이터의 시각화를 위해 설계되었습니다. 데이터는 최대 13 개의 변수를 동시에 표시 할 수있는 3D 개체 모음 (각 데이터 그룹에 하나씩)으로 표시됩니다. 데이터 변수와 시각적 피쳐 간의 관계는 다른 기술 (예 : 평행 좌표)보다 훨씬 더 쉽게 기억할 수 있습니다.
데이터에서 어떤 유형의 패턴을보고 싶지 않습니다. t-SNE 및보다 빠른 변형 Barnes-Hut-SNE은 고차원 데이터 관련 개념 그룹을 시각화하는 데 매우 효과적입니다. R을 통해 사용할 수 있습니다.
약 300 차원의 고차원 데이터에 대해 사용하는 간단한 자습서가 있습니다. http://www.codeproject.com/Tips/788739/Visualizing-High-Dimensional-Vector-using-T-SNE-wi
http://www.ggobi.org (둘러보기, 평행 좌표, 산점도 행렬)을 실 변수에 사용할 수 있습니다. 최근 http://cranvas.org도 있습니다. R의 여행자 패키지
나는 고차원 데이터를 시각화하는 방법을 찾고 있었고 효과적으로 사용 된 t-SNE technique이라는 것을 발견했습니다. 다른 사람들을 도울 수 있습니다.
http://hypertools.readthedocs.io/en/latest/을 사용해보세요.
HyperTools는 파이썬에서 고차원 데이터를 시각화하고 조작하기위한 라이브러리입니다.
- 1. 고차원 필드 화살표를 시각화 하시겠습니까?
- 2. DataSet 시각화 프로그램을 응용 프로그램에 표시 할 수있는 방법이 있습니까?
- 3. Zend_Filter_Input에서 필터링 된 데이터를 출력 할 수있는 방법이 있습니까?
- 4. WPF의 컨트롤을 정렬 할 수있는 격자보다 좋은 방법이 있습니까?
- 5. UITableViewCells를 확장/축소 할 수있는 방법이 있습니까?
- 6. ActionScript 3.0에서 스크롤 할 수있는 영역 시각화
- 7. Java에서 Google 시각화 API를 사용하는 방법이 있습니까
- 8. 일반 methodInfo를 호출 할 수있는 방법이 있습니까?
- 9. 코코아에서 고차원 베 지어 경로
- 10. PDF를 가로로 스크롤 할 수있는 방법이 있습니까?
- 11. PictureBox에 반투명하게 페인트 할 수있는 방법이 있습니까?
- 12. TriggerAction 클래스에서 상속 할 수있는 방법이 있습니까?
- 13. 아이폰에 데이터베이스를 공유 할 수있는 방법이 있습니까?
- 14. XDocument에 서명 할 수있는 방법이 있습니까?
- 15. TinyScheme에서 입출력을 라우팅 할 수있는 방법이 있습니까?
- 16. 결과 쿼리를 메모리에로드 할 수있는 방법이 있습니까?
- 17. Mediafire 링크를 다운로드 할 수있는 방법이 있습니까?
- 18. DataGrid에서 CheckBox를 표시 할 수있는 방법이 있습니까
- 19. JavaScript로 마우스를 구별 할 수있는 방법이 있습니까?
- 20. 하스켈에서이 프로그램을 최적화 할 수있는 방법이 있습니까?
- 21. RubyGems를 오프라인으로 업데이트 할 수있는 방법이 있습니까?
- 22. jQuery에서 이벤트를 위임 할 수있는 방법이 있습니까?
- 23. 도장에서 현지화를 해제 할 수있는 방법이 있습니까?
- 24. Mechanize를 Python으로 대체 할 수있는 방법이 있습니까?
- 25. 인라인 문자열을 "플러시"할 수있는 방법이 있습니까?
- 26. ConfigurationManager.AppSettings를 재정의 할 수있는 방법이 있습니까?
- 27. Subversion에서 파일을 "고정"할 수있는 방법이 있습니까?
- 28. Rails3 - NOTLIKE 할 수있는 방법이 있습니까?
- 29. 이 코드를 최적화 할 수있는 방법이 있습니까?
- 30. Celery/RabbitMQ를 영속화 할 수있는 방법이 있습니까?
답을 알 수는 없지만이 문제를 최적화하는 것이 매우 중요한 연구 주제라고 말할 수 있습니다. –
Tableau 또는 Spotfire와 같은 시각화 도구를 사용하는 것이 좋습니다. 그럼에도 불구하고, 21 차원이 많이 있기 때문에 의미있는 수준으로 만들기 위해 일종의 차원 축소 기법을 수행해야 할 것입니다. http://www.tableausoftware.com/public –