2013-11-09 3 views
1

generate 내 데이터 집합의 변수 gdp_cp의 지연 변수를 원합니다. 데이터 집합은 다음과 같습니다지연 변수를 생성하면 누락이 발생합니다.

year | gdp_cp 
1975 | 5.414e+14 
1976 | 5.786e+14 
1977 | 6.293e+14 
1978 | 6.787e+14 
1979 | 7.211e+14 
1980 | 7.923e+14 
1981 | 8.552e+14 
1982 | 8.744e+14 
1983 | 9.511e+14 
1984 | 1.017e+15 

그래서 난이 데이터 집합이 명령을 사용하여 시계열이라고 STATA 말하려고 :

: 출력 창에서

tsset gdp_cp year, yearly 

을, 나는 다음있어

gen gdp_lagged = L1.gdp_cp 
:

panel variable: gdp_cp (weakly balanced) 
time variable: year, 1975 to 2010 
     delta: 1 year 
는 다음 나는 명령을 사용하여 gdp_cp의 지연된 버전을 만들고 싶었

불행히도 Stata는 누락 된 값만 생성하므로 ... 내가 뭘 잘못 했습니까?

답변

2

tsset 명령의 첫 번째 변수는해야 id (그것이 당신의 데이터 세트에서 무엇이든, 예를 들어, 국가 등 지역, 가정). 해당 명령에 gdp을 추가하면 Stata는 각 관찰의 식별에 gdp을 사용합니다. 즉, 나머지 항목과 독립적으로 각 항목을 처리하므로 지연이 발생할 수 없습니다.

+1

또한 'float' 변수 또는 틀림없이 모든 변수에 10^14 또는 10^15 정도의 값을 저장하는 것은 좋지 않습니다. 데이터가 수많은 중요한 인물에게 주어졌지만 모두 믿을지라도 '부유물'은 모든 것을 정확하게 유지할 수있는 충분한 비트가 없습니다. 게다가'double '보다는'float'으로 계산하면 정밀도를 잃어 버리고 계수 추정 등이 너무 커지거나 너무 작아 져서 처리하기가 어색 할 수도 있습니다. 의미있는 단위를 선택하십시오 (예 : 사용 된 통화로 수십억 달러. –

+0

답변 해 주셔서 감사합니다. –

관련 문제