2014-01-29 2 views
-1

변수가 두 개인 데이터 프레임이 있다고 가정하십시오 - 이름은 &입니다. 이름은 클래스 요소 및 연령 번호입니다. 이제이 데이터 프레임에는 수천 명의 사람들이 있다고 상상해보십시오. 어떻게합니까 :발생 및 히스토그램 차트 계산 중 R

  1. 다음과 같은 테이블 생성 : NAME | 각 이름의 COUNT (NAME)은 고유합니까?

  2. 히스토그램에 표시 할 최소 건의 숫자를 변경할 수있는 막대 그래프를 생성합니다.

2 부에서는 최소한 다른 빈도 값을 테스트하고 히스토그램이 어떻게 나오는지보고 싶습니다. 또는 히스토그램에 입력 할 각 이름의 최소 개수를 결정하는 더 좋은 방법이 있습니까?

감사합니다.

편집 : 여기에 테이블이 RDBS의 같을 것이다 것입니다 :

NAME | COUNT(NAME) 

John | 10 
Bill | 24 
Jane | 12 
Tony | 50 

엠마누엘 | 1 ...

내가 할 수있는 일은 그래프로 표시 할 최소 빈도를 설정하는 값을 변경할 수있는 막대 그래프를 그래프로 표시하는 함수를 만드는 것입니다. 더 이해가 되니? 당신은 무엇을 작동하지 않았다, 이미 시도, 어디 정확히 당신이 도움이 필요 무엇

+0

? 오, 그리고 우리가 사용할 수있는 데이터가 있습니까? 도움이 필요하면 http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example을 참조하십시오. –

+0

그래서'table()'함수를 발견했습니다.이 함수는 이름 배열을 전달할 때 자동으로 카운트를 제공합니다. 나는 거기에서 잘해야한다. 히스토그램의 경우'plot (df.counts $ NAME [which (df.counts> 10)]); '을 사용하고 있지만이 방법은 작동하지 않습니다. –

+0

당신이 제공 한 것부터'df.counts'가 어떻게 보이는지'NAME' 요소가 무엇인지 알 수있는 방법이 없습니다. 초기 data.frame이'd'이고 이름이'name' 요소에 있다고 가정하면'plot (as.table (d $ name) [table (d $ name)> 10])) ' – jbaums

답변

0
> x <- read.table(textConnection(' 
+ Name Age Gender Presents Behaviour 
+ 1 John 9 male  25 naughty 
+ 2  Bill 5 male  20  nice 
+ 3  Jane 4 female  30  nice 
+ 4  Jane 4 female  20  naughty 
+ 5  Tony 4 male  34 naughty' 
+), header=TRUE) 
> 
> table(x$Name) 

Bill Jane John Tony 
    1 2 1 1 
> layout(matrix(1:4, ncol = 2)) 
> plot(table(x$Name), main = "plot method for class \"table\"") 
> barplot(table(x$Name), main = "barplot") 
> tab <- as.numeric(table(x$Name)) 
> names(tab) <- names(table(x$Name)) 
> dotchart(tab, main = "dotchart or dotplot") 
> ## or just this 
> ## dotchart(table(dat)) 
> ## and ignore the warning 
> layout(1) 

enter image description here

+0

이것은 위대한 prasanna,하지만 난 최소 임계 값을 사용자 정의 할 수있는 히스토그램 (빈도) 차트를 찾고 있어요. 예를 들어, 데이터 프레임에 1000 개의 레코드/관측치, 다른 모든 이름이있는 경우 각 이름이 몇 번 나왔는지 차트에 표시하고 최소 횟수를 설정할 수 있습니다 (그렇게하지 않으면 단지 몇 번씩 일어나는 이름을 그립니다). 이해가 되니? –