2016-06-02 3 views
-3

WB 데이터 (.xlsx 양식) 분석을 실행하려고 시도했지만 데이터가 회귀 할 준비가되지 않았습니다. 현재 각 행에는 다른 국가의 데이터가 포함되어 있으며 각 열은 특정 연도의 데이터입니다.세계 은행 데이터 수정

이상적으로, 세 개의 열 (국가, 연도 및 MeanValue)의 새로운 시트/데이터 테이블을 만들고 싶습니다. MeanValue의 각 행은 원본 시트의 각 연도 열에 대한 평균값과 같습니다.

누구나 올바른 방향으로 나를 가리킬 수 있습니까? 감사.

답변

0

wbstats 패키지를 살펴볼 수 있습니다 (월드 뱅크 데이터도 쉽게 얻을 수있는 다른 것들이 있다고 생각합니다). 당신은 2000 년부터 2016 년 현재 미국 달러 시장 가격에 GPD의 모든 국가에 대한 데이터를 얻기 위해, 예를 들어 R.에 직접 데이터에 액세스 할 수 있습니다 그 방법 : 다음

dt <- wbstats::wb(indicator = "NY.GDP.MKTP.CD", startdate = 2000, enddate = 2016) 

당신은 단지 열을 선택해야합니다 이 같은 dplyr를 사용하여 예를 들어, 유지하려는 :

library(dplyr) 

dt <- tbl_df(dt) 
dt %>% arrange(country, date) %>% select(country, date, value) 
Source: local data frame [3,441 x 3] 

     country date  value 
     (chr) (chr)  (dbl) 
1 Afghanistan 2001 2461666315 
2 Afghanistan 2002 4128818042 
3 Afghanistan 2003 4583648922 
4 Afghanistan 2004 5285461999 
5 Afghanistan 2005 6275076016 
6 Afghanistan 2006 7057598407 
7 Afghanistan 2007 9843842455 
8 Afghanistan 2008 10190529882 
9 Afghanistan 2009 12486943506 
10 Afghanistan 2010 15936800636 
..   ... ...   ... 

난 당신이 평균 값을 참조 할 때 각 국가 및 연도에 대한 행을 유지하는 경우가 외설 때문에 당신이 원하는 것을 확실하지 않다 그 이상을 의미하는 것은 없습니다.