2012-09-18 3 views
1

저는 뉴 멕시코의 기후 데이터로 작업하고 있으며 나는 초보자입니다. 나는 수단으로 NA를 대체하려하지만 내 df에는 37 개의 다른 사이트가 있습니다. DF $ STATION.NAME (열 1)이 고유 한 열의 수단이 필요합니다. 한 위치의 데이터를 사용하여 다른 데이터의 평균을 찾을 수는 없습니다 ... 분명히. 그래서 각 방송국마다 매달 평균을 가져야합니다.열은 한정된 범위의 행을 의미합니다.

내 데이터는 열 1에 세로로 station.name으로 구성되고 끝 (오른쪽)에 총 열을 포함하여 다음 열에서 월 jan-dec에 대해 판독됩니다. 독서 또는 관측은 수년에 걸쳐 매월 각 스테이션에 대한 것입니다 (각 새해마다 새로운 행에 나열된 스테이션 이름).

NAs를 주어진 시간 동안 CLDD의 합계로 대체해야합니다 station.name, 어떻게해야합니까?

+0

안녕하세요. 안녕하세요. StackOverflow에 오신 것을 환영합니다. 실제로 많은 숙련 된 R 사용자가 있습니다. 이 질문을 개선하기위한 한 가지 제안은 (작은) 재현 가능한 예제를 제공하는 것입니다 (제안 사항은 [이 페이지] (http://stackoverflow.com/q/5963269/1281189) 참조). – BenBarnes

+0

또한 그룹화 된 데이터 행을 통해 계산을 수행하는 방법을 시작하려면 [이 질문 (http://stackoverflow.com/q/10748253/1281189)을 참조하십시오. – BenBarnes

+0

감사합니다. Ben, 도움이되었습니다. 환호 – user1680636

답변

0

https://stats.stackexchange.com/ ( 태그로 제안 됨)에 대한 질문을 시도하면 일반 프로그래밍 사이트보다 R 사용자 수가 많을 것입니다. 질문에 태그를 추가했습니다.

데이터를 역 - 월 하위 집합으로 나누고 거기에 누락 된 값을 채운 다음 하나의 큰 행렬로 다시 어셈블하는 데는 아무런 문제가 없습니다. 수단, 중간 값 또는 모드로 누락 된 값을 채우는 관행이 인기가 Replace mean or mode for missing values in R

하는 것으로, 그러나 이것은 분명히 분산을 줄일 수 있기 때문에 결과를 희석 수 있습니다

도 참조하십시오. 누락 된 값을 보간 할 수있는 이유와 방법을 강하게 물리적 인 주장이없는 한, 누락 된 값을 직접 처리 할 수있는 방법을 찾을 수 있다면 더 우아 할 것입니다.

+0

이것에 대해 감사드립니다 ... 매우 빨리 돌아 오지는 않았지만 도움이되었습니다. – user1680636

관련 문제