2013-09-05 1 views
1

여러 소스, 적절한 조회 테이블/메타 데이터 및 일부 데이터가있는보고 사무실에서 SAS의 형식을 효율적으로 관리 할 수있는 방법이 궁금합니다.다양한 소스에서 SAS 포맷을 어떻게 관리합니까?

적절한 메타 데이터가있는 데이터 원본의 경우 값 설명을위한 조인 테이블이 잘 작동하지만 메타 데이터가 존재하지 않고 별도로 유지 관리해야하는 경우 어떻게 수행해야합니까? 몇 가지 간단한 예/아이디어 : 별도로 관리되는 기본 PROC FORMAT 단계와

  • 일반 .sas 파일.
  • 별도로 관리되고 형식 라이브러리를 만들기 위해 SAS로 가져온 외부 파일 (예 : Excel, CSV).
  • 형식 라이브러리를 읽기 위해 읽을 수있는 데이터베이스 테이블이 별도로 유지 관리됩니다.

형식이 지정된 값 외에도 값 변경 관리 (즉, 인증 값의 유효 날짜)도 중요합니다.

이러한 유형의 작업에 적합한 협약이나 표준에 도움이된다면 크게 감사하겠습니다.

답변

1

은 여기 하나의 가장 좋은 방법이 확실하지 않다 -는 등 사용자 환경, 사용자에 크게 의존

당신이 매우 순진한 사용자를 가지고 있다면, 나는 확실히 하나의 완전한 저장소 경우를 권 해드립니다 가능한; 단일 SAS 버전/OS/bitness를 사용하는 경우 .sas7bcat 파일인지 또는 PROC FORMAT (및 가져 오기를 수행 할 autoexec에 포함 된 .sas 파일)로 입력 할 수 있도록 미리 만들어진 테이블/데이터 세트인지 여부를 지정합니다. 가장 큰 단점은 적극적으로 관리해야한다는 것입니다 (예를 들어 사용자가 다른 형식을 덮어 쓸 수 있기 때문에 사용자가 마스터 형식 데이터 집합에 자신의 형식을 쓸 수 없으며 형식을 보장하기위한 추가 작업이 필요함) 이름이 충돌하지 않습니다. YNF.1=YES 2=NO 또는 1=YES 0=NO이거나 다른 것일 수 있습니다. 이것은 또한 효과적인 날짜를 매우 쉽게 처리 할 수는 없습니다. 하지만 이것은 사용자에게 더 나은 방법 일 수 있습니다. (그리고 나서 문서를 별도로 처리하십시오.)

고급 사용자가있는 경우 자연에서보다 관계형 인 테이블/데이터 집합을 고려할 수 있습니다.

  • 형식 이름
  • 시작
  • 라벨
  • 기타 요소 (유형, HLO 등 (고유성을 보장하기 위해 필요한 자격을 갖춘)

    1. 데이터 집합 이름 : 하이브리드 접근 방식은 열이 데이터 집합을 포함 할 수 있습니다 .)
    2. 시행일 사용자가 할 수있는 것

  • 자신의 (어쨌든 데이터 셋 이름을 제대로 추가 할 수있을 정도로 충분히 신뢰할 수 있다고 가정하고 충돌을 검사 한 임시 테이블에서 추가 작업을 수행하도록 저장된 proc를 설정하고) 충돌 한 형식 이름을 처리 할 수있게합니다. 필요한 경우 여러 데이터 집합을 사용하여 처리 할 수있는 방법이 있어야합니다 (예 : 'dataset ID'와 같은 형식 이름에 고유 한 요소를 추가하는 등).

    그러나 내 생각에 가장 좋은 방법은 데이터 사전을 사용하여 자체 문서와 메타 데이터 관리를 결합한 메타 데이터를 처리하는 것입니다.위와 마찬가지로 데이터 세트 및 형식 요소가있는 테이블이 있지만 사용 사례에 따라 설명 텍스트 (예 : 질문 설명) 및 기타 유용한 정보를 추가 할 수 있습니다. 이것은 데이터베이스 테이블이나 데이터 세트에서 관리 할 수 ​​있으며, 프로그래머가 아닌 사람들과 공유하고 쉽게 편집 할 수있는 Excel 또는 유사한 문서에서 더 유용하게 사용할 수 있습니다. 이 방법을 여러 프로젝트에 사용하고 사용자가 내 코드에 대한 문서를 작성하고 프로그램을 정확하고 최신 상태로 유지하면서 업데이트에 대한 앞뒤의 토론을 최소화하도록 도와줌으로써 성과를 올렸습니다. 데이터를 실행할 때마다 스프레드 시트를 가져오고 proc 형식을 실행하기 만하면됩니다.

    그런 다음 모든 데이터 세트가 포함 된 데이터 세트, 탭 또는 전체 스프레드 시트 하나당 하나의 스프레드 시트를 사용할 수 있습니다. 가장 손쉽게 사용할 수 있습니다. 이는 스프레드 시트에서 처리 할 수있는 '효과적인 날짜'유형 문제 또는 버전 관리를 쉽게 처리합니다.

    +0

    철저히 입력 해 주셔서 감사합니다. 가장 큰 위험은 모든 형식을 유지할 때 일관성을 확실히 제어하는 ​​것입니다 (일반적으로 최신 상태를 유지하는 것 이외에). 나는 평범한 구형 엑셀 워크 북을 사용하고 싶다. 메타 데이터 (유효 날짜와 같은), 포함 또는 매크로를 통한 처리의 유연성 및 내 상황의 모든 사용자가 Excel에 익숙합니다. 초기 결정은 원시 SAS 형식에 의존했지만, 'PICTURE'또는 기타 특수 SAS 형식 요구에만 사용할 수 있으며 모든 "정상적인"키 - 값 형식은 Excel에서 사용할 수 있습니다. – chucknelson

    관련 문제