2012-02-09 5 views
0

나는 1354 개의 숫자가있는리스트 (intensityList)를 가지고있다. 그들은 25941.9에서 1639980000.0까지 다양합니다. 그래서 매우 큰 차이가 있으며, 대부분의 점은 25941.9보다 1639980000.0에 더 가깝습니다. 나는이히스토그램을 플로팅 할 때 값의 큰 차이를 처리하는 방법은 무엇입니까?

plt.hist(intensityList,20) 
plt.title('Amount of features per intensity') 
plt.xlabel('intensity') 
plt.ylabel('frequency') 
plt.show() 

에서 히스토그램을 만들 때 한 줄에 거의 모든 데이터를두고 x 축를 망쳐 놨어요. 그것은 테스트 세트 (임의의 일반 숫자)와 함께 작동하므로 나는 그것이 넓은 범위와 관련이 있다는 것을 확신합니다. 이런 데이터 집합을 어떻게 처리 할 수 ​​있습니까?

편집 : 데이터가 매우 비뚤어지고, 표준 편차가 평균보다 훨씬 큽니다. (= 6501401.54114, 표준 devaition 의미 = 49423145.7749)

답변

2

아주 분명한 대답은, 당신이 아래로 질문을 쓸 때 그것이 내가 값을 기록 .. 도움이 보여주고 그것의 모든 멋쟁이

당신이 쓰레기통의 수를 늘릴 수 있습니다
+0

나는 이것을 말할 것입니다! – samb8s

1

또는 관심있는 범위의 값만 유지하십시오.

intensityList = intensityList[intensityList < maxVal] 
intensityList = intensityList[intensityList > minVal] 
+0

그것도 생각하고 있었지만, 쓰레기통이 도움이되지 않았고 데이터를 잃고 싶지 않았습니다. 로그를 사용하면 나를 위해 더 잘 작동하지만, 답변을 주셔서 감사합니다. –

관련 문제