2012-11-09 6 views
2

방금 ​​전에 Excel을 R로 사용하기 시작했습니다. 내가 다루는 데이터베이스는 매우 커서 데이터베이스와 더 잘 작동하는 새로운 도구가 필요했습니다. 필자는이 웹 사이트에서 R 스크립트에 대한 많은 답을 찾을 수 있었지만 특정한 유형의 분석에 대해서는 결정적인 것을 찾을 수 없었습니다.R : 고유 한 범주 형 값 계산 R

내 데이터는 다음과 같습니다

Col1 Col2  Col3 ... Col50 

M 18-24  Single ... Employed 

F 18-24  Married ... Unemployed 

F Under 18 Single ... Employed 

보통 심지어 10 행과 30 가지고 다루는 데이터베이스 - (70) 열을 일반적으로 거기에 열이 아닌 당 20 개 이상의 고유 한 값

무엇

Col1 

Variable name/F/M 

Frequency/2/1 

..... 

Col50 

Variable name/Employed/Un-employed 

Frequency/2/1 

하는 anyb 수 : 내가 원하는 각 열에서 각각의 고유 한 값을 나에게 주파수 카운트를 줄 것이다 부분 집합 출력 ody는 최소한 저의 범주 적 가치를 계산하기 위해 내가 찾아야 할 것을 알려줍니다. 특별한 패키지가 필요합니까? 나는 값을 계산 일부 기능을 발견 할 수 있었다, 그러나 그들은 단지

+2

를'사용할 수있는 각각의 컬럼에 테이블을 적용하려면 – Dason

답변

5

table 당신이 원하는 것처럼 소리 "table()function".

데이비드 로저스 (같은 숫자 값을 참조하십시오. 그것은 당신에게 각각의 발생 횟수를 줄 것이다 . 값은 쉽게 우리가 범주 형 변수에 대한 작동 table` lapply

lapply(your_data, table) 
# Example use and output 
lapply(mtcars, table) 
+1

'David'을 -. 나는() 테이블'로 당신을 던지고 어떻게 생각 '이 최선의 방법이다 벡터 (범주 형이든 아니든간에)와 데이터 프레임 (특히 큰 프레임)에 적용됩니다. 에스). 'lapply'를 사용하면 각 열에 대한 테이블을 벡터로 수행 할 수 있습니다. select 열에 대해서만 테이블을 원한다면 다음을 실행하십시오 :'lapply (your_data [, c ("ColName1", "ColName2")], 테이블)' –

+0

정말 고마워요. 이론적으로는 문제가 해결되지만, 실제로는 아직 갈 길이 멀다. 그것은 내가 csv로 결과와 함께 하위 집합을 쓰고 싶다면, R은 행 수에 차이가 있다는 것을 알려주지 않을 것입니다. 이걸 어떻게 극복 할 수 있을지에 대한 아이디어가 있습니까? 모든 최고의 David –

+0

새로운 질문을하고 원하는 결과물을 제공 할 것을 제안합니다. 예를 들어 출력 파일을 어떻게 보이게할까요? – Dason