2017-09-18 1 views
0

나는 종이에서 데이터 테이블로 그래프를 만들고 있습니다. 그것은 관계의 범주 열이 수치 변수의 두 개의 열 : 각 범주에 대한 관찰의 수와 다음의 IQ 상관 관계카테고리에 대한 관측 수를 알려주는 방법

relation num corr 
spouse  3817 0.33 
MZ-twin-tog 4671 0.86 
MZ-twin-ap 65 0.72 
DZ-twin-tog 5546 0.6 
sib-tog 26473 0.47 
sib-ap  203 0.24 
off-par 8433 0.42 
off-midpar 992 0.5 
off-par-ap 814 0.22 

내가 (CORR ~ 관계)의 상자 그림을 만들고 싶어하지만 너비가 각 카테고리의 관측 수에 비례하도록하십시오. 불행히도 varwidth = TRUE는 작동하지 않을 것입니다. 왜냐하면 전체 데이터 세트로 작업하지 않기 때문에 카테고리 당 하나의 관찰 만 효과적으로 수행하기 때문입니다.

누구나 완전한 데이터가 없기 때문에이 작업 방법을 알고 있습니까, 결과 만.

P. 나는 boxplot이이 제한된 데이터 세트에 대한 적절한 그래프가 아니라는 것을 알고 있지만, 어떻게 표시해야할지 모르겠다 (수치 적 ~ 범주 적). 제안을 환영합니다!

미리 조언 해 주셔서 감사합니다.

+0

당신은이 같은 간단한 요약 데이터 상자 플롯을 만들 수 없습니다. 상자 플롯의 영역 크기는 데이터의 최소, 최대, 중앙값 및 1/3 분위로 정의됩니다. 상자 그림은 데이터 분포를 표시하기위한 것입니다. 이 요약을 시각화하여 설명하고자하는 것은 무엇입니까? – Mako212

+0

응답 해 주셔서 감사합니다. 어떤 그룹이 더 높은 상관 관계를 갖고 있는지 시각화하고 싶었습니다. 어떤 그룹이 더 높은 n을 가졌는지 보여주는 것을 포함 시켰습니다. (그룹 크기가 매우 다양하기 때문에). 아래의 막대 그래프를 보면 y 축의 변수 "corr"과 오른쪽의 히트 맵의 변수 "num"만으로 정확히 찾고 있다고 생각합니다. 스위치를 만들기 위해 제공 한 코드를 변경할 수 있다고 확신합니다. 정말 고마워요, 정말 고마워요. –

답변

0

은 데이터 :

require(ggplot2) 

g1 <- ggplot(df1, aes(relation, num))+ 
    geom_bar(aes(fill=corr),stat="identity")+ 
    theme_bw() 

enter image description here

또는 각 응답의 비율이 음모를 꾸미고 :

df1 <- structure(list(relation = structure(c(9L, 3L, 2L, 1L, 8L, 7L, 
5L, 4L, 6L), .Label = c("DZ-twin-tog", "MZ-twin-ap", "MZ-twin-tog", 
"off-midpar", "off-par", "off-par-ap", "sib-ap", "sib-tog", "spouse" 
), class = "factor"), num = c(3817L, 4671L, 65L, 5546L, 26473L, 
203L, 8433L, 992L, 814L), corr = c(0.33, 0.86, 0.72, 0.6, 0.47, 
0.24, 0.42, 0.5, 0.22), num_pct = c(0.0748225977182734, 0.0915631003254009, 
0.00127416003450033, 0.108715254635982, 0.518935978358882, 0.00397929980005489, 
0.165307562629866, 0.019445642372682, 0.015956404124358)), .Names = c("relation", 
"num", "corr", "num_pct"), row.names = c(NA, -9L), class = "data.frame") 

이 같은 막대 그래프를 고려 (I 두 플롯에 색상을 corr를 매핑) :

먼저 퍼스를 계산합니다. 국세청 :

df1$num_pct <- df1$num/sum(df1$num) 

그런 줄거리 :

g2 <- ggplot(df1, aes(relation, num_pct))+ 
geom_bar(aes(fill=corr),stat="identity")+ 
scale_y_continuous(labels=scales::percent)+ 
theme_bw() 

enter image description here

관련 문제