이제 주요 관심 변수 2 개 (Major 및 Major_Code)가있는 데이터 세트가 있습니다. 이것들은 1 대 1과 일치해야하지만, 수정해야 할 몇 가지 오류가 있습니다. 그리고 내가 발견 한 것은 14 가지 Major_Code 값에 대해 두 개의 다른 전공이 있다는 것입니다. 이것은 "에드."와 같이 철자 또는 구두점이 변경된 경우에만 발생합니다. 및 "교육". 그들은 여기에 같은 가치를 가지고 있지만 그렇게하지 말아야합니다.SAS는 하나의 관측 값을 사용하여 다른 관측 값을 덮어 씁니다.
그래서 7 쌍의 테이블이 있습니다. 각 쌍은 Major_Code가 같고 Major가 다릅니다. 각 코드에 사용할 주요 값 중 하나를 선택하려면 어떻게합니까? 나의 유일한 생각은 if-then 진술을 통해서 였지만, 그것은 무시 무시하게 비효율적 인 것처럼 보인다.
난과 같이 배 값 발견PROC 주파수 데이터 = majorslist 단계; 테이블 Major_Code/out = majorcodedups; 실행;
proc 인쇄 데이터 = majorcodedups; 여기서 COUNT> 1; 실행;
그래서 나는이 관측치를 쉽게 찾을 수 있지만 다른 관측치에 덮어 쓰기 위해 특정 값을 추출 할 수는 없습니다. 나는 배열, 매크로, SQL과 조바꿈을 들여다 보았다.하지만 지금은 내 머리 위로 조금이다.
논리적으로는 다음과 같이 작동 것이다 :
을 OBS에서 제가 N, 난 OBS I에서 변수 Y 상 출력 값이 이전 기지국 (I + 1)를 반복 이동 OBS에서 변수 x의 값을 찾기.
"중요한"값의 선택 방법을 결정하는 것이 중요합니다. 나머지는 쉽습니다. – Joe