2011-04-09 3 views
0

R에 대한 두 가지 질문 : 1. 여러 열 값을 가진 데이터 집합이 있고 열 값 중 하나가 ' test_score '빈 열 (및/또는 숫자가 아닌 값)이있는 열을 해당 열에 어떻게 제외시킬 수 있습니까? (pie(), hist() 또는 cor() 사용)기본 R - 빈 열이있는 행을 제외하는 방법, 특정 열 값에 대한 데이터를 표시하는 방법

2) 데이터 세트에 'Teachers'라는 열이있는 경우 Teacher = Jones 행의 'testscores'열을 어떻게 그래프로 표시 할 수 있습니까?

는 누락 된 데이터없이 별도의 벡터를 만들기 : 두 개의 열이 연결이 유지해야하기 때문에

dat.nomissing <- tenthgrade[!is.nan(Score),] 

이 문제가 보인다. 나는 같은 것을 생각했다 :

hist(!is.nan(tenthgrade$Score)[tenthgrade$Teacher=='Jones']) 

그러나, is.nan은 TRUE, FALSE 값 목록을 (예상대로) 만드는 것입니다.

+1

데이터, 또는 그것의 모의 복제를 표시합니다. –

+1

R : http://cran.r-project.org/manuals.html과 함께 제공되는 설명서 중 하나를 확인합니다. 또는 R에 대한 질문을 여기서 알아볼 수 있습니다.이 모든 것들은 최근에 상세히 답변되었습니다. – Chase

+0

슈퍼 유저에게 질문을 올렸습니다. 너무 기본적인 것 같았고 나는 정보를 가지고 그것을 어떻게 할 것인지를 알아야한다고 느꼈다. 그러나 그렇지 않았다. – Donnied

답변

2

subscripting을 사용하십시오.

dat[!is.na(dat$test_score),] 
hist(dat$test_score[dat$Teachers=='Jones']) 

그리고 인공 데이터를보다 완전한 예 : 예를 들어

# Create artificial dataset 
dat <- data.frame('test_score'=rnorm(500), 'Teachers'=sample(c('Jones', 'Smith', 'Clark'), 500, replace=TRUE)) 

# Introduce some random missingness 
dat$test_score[sample(1:500, 50)] <- NA 

# Keep if test_score is valid                  
dat.nomissing <- dat[!is.na(dat$test_score),] 

# Plot subset of data           
hist(dat$test_score[dat$Teachers=='Jones'])                  
관련 문제