나는 같은 형식이 데이터 프레임을 다음R에서 집계 된 데이터로 어떻게 히스토그램을 만들 수 있습니까?
Month Frequency
2007-08 2
2010-11 5
2011-01 43
2011-02 52
2011-03 31
2011-04 64
2011-05 73
나는 X 아마 약 15이 될 것이다 (X 쓰레기통을 사용하여이 데이터에서 히스토그램을 생성하고 싶지만, 실제 데이터가있다 200 개월 이상), 빈도 열의 데이터를 히스토그램의 각 빈에 대한 빈도로 사용합니다. 이것을 어떻게 할 수 있습니까?
hist() 및 barplot() 명령을 사용하여 지금까지 두 가지 방법을 시도했습니다. hist() 문제는 히스토그램의 빈도 계산에서 빈도 열을 사용하도록 지정하는 방법을 제공하지 않는 것 같습니다. barplot()의 문제점은 X bin을 선택하는 데 유연성이 없다는 것입니다. 생략 된 달이있는 경우 결과 그래프는 실제로 x 축이 연속이 아니기 때문에 실제로는 히스토그램이 아닙니다.
barplot() 접근법을 사용하여 빈도를 0으로 채우고 빈 사이에 간격을 제거하려면 공백 = 0을 사용하는 것이 유일한 아이디어입니다. 문제는 임의의 개수의 저장소를 선택하는 것이 특히 쉽지 않다는 것입니다.
나는 질문을 던졌을 때, 내가 단순하게 제시 한 것보다 내 주파수가 실제로 1 백만에서 5 천만 달러에 이른다는 것을 간과했기 때문에 나는 그것을 너무 많이 단순화했다. 이 주파수는 너무 높아서 내 컴퓨터의 원시 데이터 (8GB RAM)에 'rep'를 사용할 수 없습니다. 나는이 주파수들을 나의 목적을위한 충분한 히스토그램 (즉, 확률 분포)을 준 작은 스케일 (1 ~ 100,000)로 변환했다. 나는 일반적으로 당신의 대답을 좋아합니다. 그리고 지금까지 제가 "진정한"히스토그램을주는 유일한 해결책입니다. 감사! –
주파수가 너무 높으면 expdat <- dat [rep (1 : n, times = dat $ f/1000), "x", drop = FALSE] 주파수 계수를 간단히 축소 할 수 있습니다. – Marian