2013-04-22 4 views
5

우리는 지금 약 4 개월 동안의 BigQuery를 실행하고 우리는 몇 가지 흥미로운 관찰과 질문에 대한 가격 책정에 있습니다Bigquery 가격 차이가 있습니까?

  1. 가격 모델이 조인은 설명을 필요로 확실히 설명 할 수없는 것입니다, 노동 조합 등 가입하고 난 실행하면
  2. 에를 작은 테이블에 내 데이터 처리 bigquery 엔진 안에 곱한 작은 테이블의 각 복사본에 대한 증가 할 것인가?
  3. 동일한 하위 쿼리를 쿼리 내에서 다시 사용하는 경우 동일한 하위 쿼리와 관계없이 새로운 데이터 처리입니까? 이것이 어떤 식 으로든 최적화 될 수 있습니까? bigquery가 데이터를 캐시하지 않습니까?
  4. 데이터 처리를 위해 반올림되는 최소 크기가 있습니까? 우리의 관찰은 이것이 4MB라고 생각합니다. 맞습니까?
  5. Google 콘솔에 지리적 위치에 문제가 있습니다. 대부분의 쿼리가 CA에서 수행되었는데 내 회사가 유럽에 있고 모든 개발이 완료 되었기 때문에 잘못된 것입니다. 모든 IP 주소를 검사했는데 CA IP가 없습니다. 더 자세한 보고서를 얻을 수 있습니까?
  6. 5에 관해서는, 우리는 각각의 쿼리 및 가격의 히스토리를 얻고 싶습니다. 우리는 어떻게이 일을 할 수 있습니까? 우리의 소프트웨어가 이것을해야합니까?
  7. 3) 데이터 처리와 관련하여이 큰 문제가 있습니다 (이것이 내가 모든 질문을 한 이유입니다). 내 전체 데이터 세트가 약 150MB 크기이지만 쿼리 당 내 DP 크기가 3 배 더 큽니까? bigquery가 내 전체 데이터를 읽으면 처리 된 데이터에 표시되는 크기에 미치지 못합니다. 모든 경우에 데이터를 다시 읽고 새 DP가 수행되는 경우는 언제입니까? 그리고 어떻게 계산합니까?

감사합니다.

감사합니다, 토미 슬라브

+0

이것이 특별한 이유가 있습니까? –

+0

내가 0에 upvoted 그래서 –

답변

3
  1. 가격 책정은 읽을 필요가 무엇이든간에 소스 데이터 등, 노동 조합, 조인에 대한 아주 간단 정확히 한 번만 부과됩니다. 예를 들어 자기 조인을하는 경우에도 데이터를 한 번만 읽는 비용 만 청구됩니다.
  2. # 1 참조. 어떤 방식으로 bigquery가 내부적으로 작동하는지에 관계없이 한 번만 청구해야합니다.
  3. BigQuery는 최선형으로 데이터를 캐시합니다. 조회를 다시 실행하면 캐시가 점검됩니다. 캐시 히트가있는 경우 쿼리를 다시 실행하면 비용이 청구되지 않습니다. 전체 쿼리 결과 만 캐시됩니다. 쿼리를 수정하거나 하위 쿼리에서 사용하면 캐시가 사용되지 않습니다.
  4. BigQuery는 최소 1MB 씩 증가하며 최소 10MB입니다.
  5. Google 콘솔에서 지리적 위치를 알지 못했습니다. 이 정보는 어디서 볼 수 있습니까?
  6. jobs.list api를 통해 각각의 쿼리 기록 및 처리 된 데이터 양을 확인할 수 있습니다.
  7. 실행 한 쿼리의 작업 ID를 예상보다 크게 보낼 수 있습니까? 수행 된 계산은 8 바이트 * (정수 행 및 부동 소수점 열 읽기 수) + 2 바이트 * (읽은 문자열 열의 모든 문자열의 총 길이)입니다.

이 질문에 대한 답변을 알려주십시오.

+0

3에 대한 답변은 너무 막연합니다. 이전 (캐시 된) 쿼리를 새로운 쿼리와 결합 할 수 있고 캐시에서 비용 이점을 얻을 수 있다면 역시 관심을 가질 것입니다. 그러나 이전 쿼리에 새 하위 쿼리를 추가하자 마자 아무 것도 캐시되지 않은 것처럼 처리됩니다. –

+1

명확함, 희망합니다. –

+0

# 4를 추가 할 것입니다. - 최소 청구 크기는 관련된 테이블 당 10MB입니다. –

0

# 5에 대한 설명을 제공 할 수 있습니다.

Google API 콘솔의보고 아래에는 프로젝트에 대한 API 요청과 관련된 인구 통계 학적 정보가 있습니다.나는 이것이 BigQuery 자체와 Google API 콘솔과 관련이 적은 것으로 의심합니다.