이것은 데이터의 시각적 표현을위한 모범 사례와 R/gplot2에서 플롯을 그리는 방법에 대한 질문입니다. 나는 그래픽으로 이야기를 표현하는 방법을 찾기 위해 노력하고연속적인 범주 분리를 나타내는 플롯 그리기 (R, ggplot2)
여기 이렇게 말했다.
"우리는 500 오류는 조사 후, 우리는 시험의 400가 큰 것으로 나타났다 있던 2000 테스트 케이스를했다 1600은 Small이었고 Big 테스트의 25 개만 오류가 있었기 때문에 1600 개의 Small 테스트 중 475 개에 오류가 있음을 확인한 후 Small 테스트의 400 개가 Clockwise이고 1200 개가 Counter-Clockwise 인 것으로 나타났습니다. Small 시계 방향 테스트 중 20 개는 오류가있어서 우리는 그들을 따로 설정하여 1200 개의 작은 시계 반대 방향 테스트를 남겨 두었습니다. 그 중 455 개는 오류가있었습니다. "
즉, 테스트 케이스를 구분하기 위해 카테고리를 사용하고 있으며, 진행 상황에 따라 각 카테고리의 오류 비율이 어떻게 변하는 지 표현하고 싶습니다. 여기
는 일부 데이터와 R의 : 데이터의 소량 간단한 숫자 테이블이 최선의 선택이 될 수와tests <- data.frame(n.all=c(2000,400,1600,400,1200),n.err=c(500,25,475,20,455),sep.1=as.factor(c("all","Big","Small","Small","Small")),sep.2=as.factor(c("all","all","all","Clockwise","Counter-Clockwise")))
; 이야기가 계속되고, 점점 더 많은 분리 카테고리가 사용된다고 가정 해 봅시다. 단순히 숫자를 나열하는 것이 최선의 선택이 아니기 때문입니다.
이 데이터를 나타내는 좋은 방법은 무엇입니까? 나는 몇 가지 가능성을 생각할 수 있습니다
- 파이 차트, 파이 보여주는 조각이 날라 및 오류의 분해되고/
- 막 대형 차트에 남아 어떤에서 오류없이 비슷한
- 바 Minard's chart of Napoleon's march 유사
- 같은 멀리 분리 카테고리의 "흐름"을 나타내는 리본 차트 있지만 가진 바 분획을 나타내는 차트 수평보다는 수직보다 ,
네 가지 방법 모두 테스트 사례의 절대적인 양이 감소하고 분리 된 범주의 오류 비율과 남은 부분을 보여줍니다. 나는 4 위가 가장 좋다고 생각하지만 열린 마음을 가지고있다.
이러한 종류의 데이터를 표현하는 방법과 R/gplot2를 사용하여 데이터를 표현할 수 있습니까?
'vcd'패키지를 확인하십시오. 그러나 그것은 이것이 SO에 대한 좋은 질문이 아니라고 생각한다고 말했습니다. –
이것이 흥미로운 질문이라고 생각하지만, StackOverflow에 대해 너무 개방적이라고 생각합니다. CrossValidated는 때로는 프로그래밍 관련 개념보다 더 개념적인 데이터 시각화 질문을 환영합니다. 아마 내가 묻기 전에 채팅이나 뭔가로 물어볼 것입니다. – joran
네가 원하는 시각화를 알았 으면 코드 – alexwhan