2016-10-29 2 views
0
예비

계산 가장 일반적인 시간

이 질문은 스프레드 시트 시스템에 적용 값. 나는 문제에 대한 해답과는 반대로, 문제를 깨는 데 도움을 원한다. (비록 후자가 가장 유용 할 것이지만)

내가 알고있는 스택 오버 플로우는 특정 프로그래밍 문제에 유용하며, 제 질문을 올바르게 받아들이 기 위해 몇 가지 시도가 필요할 수 있음을 이해합니다. 제 질문을 명확하게 설명해주십시오. 제안과 그것을 업데이트 할 것입니다.

많은 데이터 초보자들과 마찬가지로 나는 지난 데이터 조회에 대한 좋은 경험을 가지고 있지만 (예 : 지난 달 조회수가 얼마나되는지) 지속적인 데이터 처리 방법을 이해하려고 애 쓰고 있습니다 (예 : 패턴을 찾는 방법, 아직 알려지지 않음).

질문

나는 각 행은 "웹 사이트 문의"를 나타내는 스프레드 시트를 가지고있다. 이 날짜 시간 열이고, 나는 같은 질문에 대답하기 위해,이 데이터에서 패턴을 발견하고 싶습니다 :

가장 일반적인 일이 무엇인지 문의
  • 을받을 수있는 일의 가장 일반적인 시간 것입니다
    • 을 주의 내가, 데이터에서 주울 수
    • 기타 유용한 정보 나 가능한 고객

    이 같은 자주 소셜 미디어 분석에서 볼 수있는 기능과 유사 할 것을 목표로 할 수 있도록 문의를받을 수 있습니다 "가장 좋은 시간은 트윗".

    나는 일이 신중한 대상이기 때문에 가장 일반적인 요일을 계산하는 것이 매우 간단하다는 것을 알고 있습니다. 그래서 나는 이것에 도움이 필요하지 않습니다!

    단순히 임의의 4 개 기간 (예 : 아침, 점심, 저녁, 야간)으로 나누고이 범위에 속하는 행 수를 계산하는 것을 피하고 싶습니다. 이 기간이 데이터를 분류하는 데 가장 적합하지 않은 경우 어떻게해야합니까?

    임의의 경계를 사용하여 데이터를 양자화하는 것 외에 다른 방법이 있습니까?

  • +1

    여기서 데이터베이스는 스프레드 시트보다 훨씬 유용합니다. – Strawberry

    +0

    피벗 테이블을 사용하여 데이터를 시각화 하시겠습니까? 날짜 필드를 시간 단위로 그룹화하십시오. 피벗 테이블은 아주 좋은 시작입니다. – MacroMarc

    답변

    1

    클러스터링을 사용하여 가장 일반적인 시간을 확인할 수 있습니다. 기본적으로, 조회의 시간 분리를 비교하여 예를 들어 평균 연결 클러스터링 기준을 사용하는 이산 1D 세트 수처럼 클러스터링합니다. 합리적으로 적은 수의 클러스터에 도달하면 가장 중요한 시간을 볼 수 있습니다 (그리고이를 평가하려면 가장 큰 클러스터의 가중 센터 인 시간 값을 사용할 수 있습니다).