포인트가 독립적 인 경우 각 측정 기준의 분포를 개별적으로 확인할 수 있습니다. Kalmagorov-Smirnov 테스트 (두 분포 간의 거리 측정)는 이에 대한 좋은 테스트입니다. 먼저 가우시안 분산 점을 생성하고 플롯하여 KS 테스트 (통계량)를 사용하여 불균일 한 분포를 감지하는 방법을 확인하십시오.
>>> import numpy as np
>>> from matplotlib.pyplot import plt
>>> X = np.random.gauss(1000, 2) # 1000 2-D points, normally distributed
>>> from sklearn.preprocessing import MinMaxScaler
>>> scaler = MinMaxScaler()
>>> X = scaler.fit_transform(X) # fit to default uniform dist range 0-1
>>> X
array([[ 0.46169481, 0.7444449 ],
[ 0.49408692, 0.5809512 ],
...,
[ 0.60877526, 0.59758908]])
>>> plt.scatter(*list(X))
>>> from scipy import stats
>>> from sklearn.preprocessing import StandardScaler, MinMaxScaler
>>> stats.kstest(MinMaxScaler().fit_transform(X[:,0]), 'uniform')
KstestResult(statistic=0.24738043186386116, pvalue=0.0)
낮은 p- 값과 높은 KS 통계량 (균일 분포로부터의 거리)는 거의 확실하게 0과 1
>>> stats.kstest(StandardScaler().fit_transform(X[:,0]), 'norm')
KstestResult(statistic=0.028970945967462303, pvalue=0.36613946547024456)
사이의 균일 한 분포로부터 오지 않았다고
그러나 높은 p 값과 낮은 KS 거리로 인해 평균 0과 표준 편차 1을 가진 정규 분포에서 나온 것일 수 있습니다.
다음 두 번째 치수 (Y)에 대한 KS- 테스트를 반복하십시오.
안녕하세요! 스택 오버 플로우는 프로그래밍 Q & A를 위해 정말 쓰일 수 있습니다. [수학적 스택 교환] (http://math.stackexchange.com/) 또는 [통계] (http://stats.stackexchange.com/)에 더 나은 기회가있을 수 있습니다. – jrdn
Cross Validated] (http://stats.stackexchange.com/questions/40928/measure-the-uniformity-of-distribution-of-points-in-a-2d-square)에서 질문을 받으면 닫습니다. –