2016-12-10 1 views
1

내가 좋아하는, 형식에있어 일부 원시 스프레드 시트 데이터를 가지고 :양자화 타임 라인 평균 데이터 및 히스토그램

12/7/2016 3:07:00, 88.05, 
12/7/2016 3:08:00, 89.10, 
12/7/2016 3:13:00, 87.00, 
etc 

이 데이터 포인트가 일정한 간격으로 샘플링되지 않고, 무작위로 하루 동안 수집됩니다.

Google 스프레드 시트를 사용하여 Google 스프레드 시트를 타임 라인 차트에 쉽게 그래프로 나타낼 수 있습니다. 이렇게하면 값이 타임 라인의 올바른 위치에 배치되고 불균등 한 샘플링 간격이 고려됩니다.

타임 스탬프를 고려하면서 타임 라인 데이터의 히스토그램을 생성하고 시간대에 대한 평균값을 계산하고 싶습니다. 단순히 내장 된 히스토그램 차트를 통해이를 실행하거나 데이터 값을 선택하고 평균 기능을 통해 실행하면 불균등 한 샘플링 간격에 의해 왜곡 될 것입니다.

내 히스토그램 및 평균을 생성하기위한 샘플링 간격 (Google 시트가 이상적)을 퀀 타이즈하는 가장 쉬운 방법은 무엇입니까? 또는, 타임 스탬프 데이터를 고려하면서 값의 히스토그램/평균을 생성하는 내장 된 메서드가 있습니까? 양자화 된 데이터가 필요하지 않습니까? 다음

답변

1

당신은 적절한 평균을 계산할 수있다 (데이터를 가정하면 범위 A2이다 : B50)

=sum(arrayformula((A3:A50-A2:A49)*(B3:B50+B2:B49)/2))/(A50-A2) 

이 수식 구현 Trapezoidal rule : 각각의 시간 간격에 할당 된 값이 관측 된 값의 평균이다 그 간격의 끝에.

내장 된 "가중치 막대 그래프"도구가 없으므로 대표적인 막대 그래프를 만들려면 다시 샘플링해야합니다. 리샘플링하는 한 가지 방법이 있습니다. 20 개의 샘플을 원한다고 가정 해 봅시다. C2에서

=arrayformula(A2+(row(1:20)-1)*(A50-A2)/19) 

을 입력하여 20 개의 균일하게 분포 된 시간 값을 얻습니다. (펜스 - 포스트 구분으로 인해 19로 나눕니다.) 그러면 D2에서

=arrayformula(vlookup(C2:C21, A2:B50, 2)) 

은 각 샘플 시간에 대한 값을 검색합니다. 그런 다음 열 D에서 막대 그래프를 만들 수 있습니다.

+0

매력처럼 작용했습니다! 감사! – arby