2013-03-27 4 views
15

내가 ggplot에서 geom_density 다음과 같은 변종의 의미에 대한 혼란 스러워요 :다른 ggplot2 밀도를 해석하는 방법은 무엇입니까?

  1. geom_density (aes_string (X = 'myVar에')) VS :

    누군가가이 네 가지 통화 사이의 차이를 설명시겠습니까

  2. geom_density (aes_string (X = 'myVar에', Y = '.. .. 밀도')) VS
  3. geom_density (aes_string (X = 'myVar에', Y = '스케일링 .. ..')) VS
  4. geom_density (aes_string (x = 'myvar', y = '.. count ../ sum (.. count ..)'))?

    • geom_density 혼자 그 영역 곡선 합계에서 1
    • geom_density-..density..와 기본적으로 동일한 작업을 수행 밀도를 생성합니다 ... :

나의 이해는 점이다?

  • ..count../sum(..count..) 모든 높이는
  • 안에 아이템 # 것만으로 각 빈을 곱한다 분모없이 자체적으로 하나
  • ..count.. 합이 보장 더욱 정규화 히스토그램 같을 피크 높이를 정상화 ..scaled.. 매개 변수는 내가 매우 직관적 ..scaled..을 발견하고 그것의 나의 해석이 맞다면 내가 그것을 무시하고 싶습니다 사용 본 적이 없다 그렇게 밀도의 최대 값이 1
  • 되어 있는지 확인합니다. 나는 주로 geom_density과 정규화 된 밀도 플롯의 차이점에 대한 설명을 찾고 있는데, 나는 이것을 ...count../... 인수가 필요하다고 가정하고있다. 감사.

    (관련 : Error with ggplot2 mapping variable to y and using stat="bin")

    +3

    관련 없음 : 정말로 aes() 내부의 변수를 인용 부호로 묶어야합니다. 'aes_string'을 사용하지 않는다면 그렇게하지 말아야합니다. – joran

    +0

    @joran :'aes_string'을 사용하고 있습니다. 죄송합니다. rpy2를 사용하고 있습니다. 항상'aes_string'입니다. – user248237dfsf

    +0

    궁금한 독자 들께. 이 질문은'aes'와'aes_string'의 관계를 수정하기 위해 편집되었습니다. 이 오류는 질문의 중심이 아니 었습니다. – Deleet

    답변

    10

    stat_density의 기본 미학 ..density.., 그래서 기본적으로 stat_density를 사용 geom_density에 대한 호출은 기본적으로 y = ..density..을 그릴 것입니다.

    당신은 다양한 열이

    densdf$scaled <- densdf$y/max(densdf$y, na.rm = TRUE) 
    

    가 원하는 경우 그것을 무시 부담으로 정의 된 source code

    ..scaled..보고 caculated하는 방법을 볼 수 있습니다.source code for stat_bin

    결과를 보면

    그래서 당신은 (기본 stat = 'bin' 사용) geom_histogram의 결과를 비교하려는 경우, 당신은 y = ..density..을 설정할 수 있으며 것 같은

    res <- within(results, { 
        count[is.na(count)] <- 0 
        density <- count/width/sum(abs(count), na.rm=TRUE) 
        ncount <- count/max(abs(count), na.rm=TRUE) 
        ndensity <- density/max(abs(density), na.rm=TRUE) 
        }) 
    

    로 계산된다 count/sum(count)을 계산하십시오 (빈의 너비를 고려함)

    geom_density(aes(y=..scaled..))을와 비교하려면 10, 당신은 그러나 당신이 곡선의 적절 자세한 근사치를 얻을 수 stat_densityadjust 매개 변수를 조정해야 할 것 geom_histogram(aes(y = ..ndensity..))

    당신은뿐만 아니라 모두 ..count..를 사용하여 동일한 규모를 얻을 수 사용합니다.

    관련 문제