나는 1354 개의 숫자가있는리스트 (intensityList)를 가지고있다. 그들은 25941.9에서 1639980000.0까지 다양합니다. 그래서 매우 큰 차이가 있으며, 대부분의 점은 25941.9보다 1639980000.0에 더 가깝습니다. 나는이히스토그램을 플로팅 할 때 값의 큰 차이를 처리하는 방법은 무엇입니까?
plt.hist(intensityList,20)
plt.title('Amount of features per intensity')
plt.xlabel('intensity')
plt.ylabel('frequency')
plt.show()
에서 히스토그램을 만들 때 한 줄에 거의 모든 데이터를두고 x 축를 망쳐 놨어요. 그것은 테스트 세트 (임의의 일반 숫자)와 함께 작동하므로 나는 그것이 넓은 범위와 관련이 있다는 것을 확신합니다. 이런 데이터 집합을 어떻게 처리 할 수 있습니까?
편집 : 데이터가 매우 비뚤어지고, 표준 편차가 평균보다 훨씬 큽니다. (= 6501401.54114, 표준 devaition 의미 = 49423145.7749)
나는 이것을 말할 것입니다! – samb8s