시스템의 대기 시간 분포를 분석하려고합니다. 대기 시간은 다음과 같은 방식으로 수집됩니다. 최대 관찰 대기 시간 (분당)이 측정됩니다.이 대기 시간이 오늘 볼 수있는 최대 대기 시간이면이 값이 기록됩니다. 마지막 날에 나는 다음과 같은 것을 가지고있다.대기 시간 분포를 측정하는 방법
[12, 15, 19, ..., 57, 120]
이것은 하루에 보이는 API 호출 시간이다. 이 데이터에서 유용한 측정 항목을 만들어야하지만 어떻게해야할지 모르겠다! 분명히이 데이터 세트의 평균 또는 중간 값을 계산하면 이해할 수 없습니다. 최대 대기 시간이 하루 중 첫 번째 분 동안 발생하면 실제 평균 또는 평균을 나타내지 않을 것입니다. 이는 평균 및 평균입니다. 네트워크 지연과 같은 드문 이벤트로 인해 이상 값이 될 수 있으므로 최대 값에 의존 할 수 없습니다. 이 아웃 라이어는 코드 품질을 나타내지 않으며 실제 오류를 포착하는 데 도움이되지 않습니다.
이 데이터에서 의미있는 통계를 작성하도록 도와 줄 수 있습니까?
특이점을 제외한 평균을 표시하려고합니까? – shuttle87
바로. 이상 치를 필요로하지만 이것은 간단합니다. – Lazin
[이동 평균] (http://en.wikipedia.org/wiki/Moving_average)과 같은 소리가 필요합니다. 그러한 평균으로부터 일정한 수의 특이 치를 제외 할 수 있습니다. – shuttle87