2014-07-08 3 views
-2

주요 과제를 제공 할 수 없으므로 수업 과제입니다. 우리는 업로드하기 위해 우리에게 주어진 특정 데이터에 하위 집합을해야합니다. 변수 이름 mydata를 지정했다고 가정합니다. csv 형식의 시트 파일을 능가합니다. 그래서, 우리는 그것을 업로드했고 다른 문제를 일으켰습니다. 여기에 업로드됩니다. mydata < - read.csv (name_of_file)업로드 된 데이터 프레임을위한 R의 서브 세트

mydata에는 헤더가있는 여섯 개의 열이 있습니다. 이제 컬럼 이름이 다음과 같다고 가정 해보십시오 : abc efg hij klm nop qrs. 이제 질문은 다음과 같습니다.

"abc 값이 < 50이고 klm < 인 추출 데이터입니다.이 하위 집합의 hij 평균은 무엇입니까?"

평균은 평균임을 알고 있습니다. 그러나, 어떻게하면이 큰 테이블의 서브 테이블과 동시에 모든 값을 추출 할 수 있으므로 두 제약 조건을 모두 충족하고 hij도 볼 수 있으므로 평균을 취할 수 있습니다. 시험에서 퀴즈이기 때문에 의미있는 방법을 보여주지 마십시오. 나는 그것을 스스로 발견 할 것이다. 그러나, 이러한 모든 제약 조건을 추출하는 방법을 보여 주시고, hij를 볼 수 있도록 전체 하위 데이터로 추출해야합니다. 적용 기능을 사용하지 마십시오. 그것은 첫 번째 테스트입니다. 지원은 두 번째 테스트에 제공됩니다. dat 만약

답변

0

는 설명 된대로 subDat에서 평균을 찾을 수있는 데이터 세트

subDat <- subset(dat, abc <50 & klm <100) 

입니다. 세트에

+0

감사합니다. 나는 모든 나의 질문을 해결했다. 그것은 일했다! – user3794490

0

또 다른 방법은 기준이 충족 된 dataframe의 모든 행을 선택합니다

subData <- mydata[mydata$abc < 50 & mydata$klm < 100, ] 

이 (원래 데이터 세트 mydata을위한)입니다. 쉼표 다음의 공백은 일치하는 행의 모든 ​​열이 반환된다는 것을 의미합니다 (dataframe subData에서).

+0

감사합니다. 나는 당신의 솔루션이 너무 효과가 있다고 확신하고 그것을보고자 노력할 것입니다. 그러나 나는 akrun 답을 사용했고 그 퀴즈에 대한 모든 문제를 해결했습니다. 다시 한 번 감사드립니다. – user3794490

관련 문제