2011-01-18 4 views
1

세 개의 변수가있는 데이터 세트가 있습니다. 하나의 연속 독립 변수, 하나의 연속 종속 변수 및 측정 수행 방법을 수치화하는 2 진 변수. 그래프를 만들 수있는 방법이 있는지까지오고 수직 라인이있는 곳R : ggplot2를 사용하여 상한 및 하한 그래프 표시

g <- ggplot(dataset, aes(independent, dependent)) 
g + geom_point(aes(color=catagory)) 

그러나, 내가 알고 싶은 : ggplot를 사용하여, 나는 내가 catagory에 의해 색깔 포인트 산포도를 만들 수 있다는 사실을 알고 catagory 0 catagory 1 지점에서 추락 수직 라인의 점에서 그것은 다음과 같이 보일 것입니다 :

- |  | | 
| |  | | 
| |  | | 
| |  | | 
- |  | o | 
| |  | | | 
| | o | | | 
| | o | | | | 
- | | | o | o 
| | | |  | 
| o | |  | 
|  | |  | 
+----|-----|-----|-----|-----| 

이 같은 플롯을 원하는 이유는 하나 개의 범주가 상한 (포인트를 나타내는 것입니다 하나는 하한을 나타냅니다 (라인이 위쪽으로 향하는 점). 이 라인을 갖는 것은 이러한 경계 사이에있는 영역을 시각화하기 쉽게 만들 것, 그리고 상단에 그려진 기능은 정확하게 데이터를 나타낼 수 있는지 여부 :이 사용 ggplot이나 다른 작업을 수행 할 수있는 방법이 있다면

- |  | | 
| |  | | 
| |  | | 
| |  | | 
- |  | o | _____ 
| |  | |_|__/ 
| | o |_/| | 
| | o |__/| | | 
- | | /| o | o 
| _|_|/ |  | 
|/o | |  | 
|/ | |  | 
+----|-----|-----|-----|-----| 

을 R을위한 그래프 라이브러리, 나는 어떻게하는지 알고 싶다. 그러나 가능하지 않다면이 데이터를 표현하는 다른 방법을 듣게 될 것입니다. 단순히 색상을 기반으로 범주를 구별하는 것은 내 목적에 따라 범주의 상한/하한을 강조하기에 충분하지 않습니다.

+0

샘플 데이터가 호의적입니까? – Chase

답변

2

다음 내용이 도움이 될 수 있습니다. 문제를 잘 이해하고 싶습니다.

먼저 샘플 데이터가 제공되지 않았으므로 데이터 프레임에 대한 임의의 데이터를 생성합니다.

dataset <- data.frame (
    independent = runif(100), 
    dependent = runif(100), 
    catagory = floor(runif(100)*2)) 

다음, 플롯의 상부 또는 하부 부분을 찾아 (값 = 최소/최대) "catagory"에 따라 : 임의 번호는 내가 실제 데이터로 더 잘 희망, 플롯 못생긴 것 모든 경우에 대해 :

dataset$end[which(dataset$catagory == 0)] <- max(dataset$dependent) 
dataset$end[which(dataset$catagory == 1)] <- min(dataset$dependent) 

이제는 geom_segment()으로 데이터를 플롯 할 수 있습니다.

g <- ggplot(dataset, aes(independent, dependent, min, max)) 
g + geom_segment(aes(x=independent, y=dependent, xend=independent, yend=end, color=catagory)) 
는 임의 datas 아주 이상한 모습으로 나는 또한 플롯에 + theme_bw() + opts(legend.position = "none") 매개 변수를 추가 한

alt text

참고.

+0

대단하군요. 당신은 문제를 완벽하게 이해했으며, 나는 그 반응에 감사드립니다. 정말 고마워. – Wilduck

관련 문제