2016-11-14 3 views
0

테라 데이타의 SAMPLE은 균일 한 확률로 선택됩니다 (즉, 모든 행에 동일한 확률이 선택됨). 예 : 테라 데이타 유니폼의 샘플 명령

select * from employee_table sample 8; 

또한 반환 된 데이터가 보장됩니다

답변

2

SAMPLE 임의의 각 실행 후 다를 수 있지만, 기본적으로하지 진정한 간단한 샘플을 사용합니다. 모든 AMP는 어떤 AMP에 의해 반환 될 행을 결정하기 위해 통신합니다. 즉, 기본값 SAMPLE은 A 샘플 당 n 개의 별도 샘플 n 개가 UNION입니다. 데이터가 해시로 분산되기 때문에주의하기가 어렵지만 NUPI가있는 비뚤어진 테이블은 일부 행을 샘플링 할 확률이 더 높을 수 있습니다.

실제 무작위 샘플이 필요하면 SAMPLE RANDOMIZED ALLOCATION 옵션을 사용해야합니다. 이제 모든 AMP의 모든 행에 동일한 확률이 적용됩니다.

하지만 무작위로 각 샘플 내에 다른 행이있는 것은 아닙니다.

관련 문제