2016-10-07 2 views
12

누군가 BigQuery 대신 BigTable을 사용하게되는 이유가 있습니까? 둘 다 후자의 오퍼링 인 고급 '조회'오퍼레이션으로 읽기 및 쓰기 오퍼레이션을 지원하는 것으로 보입니다.BigQuery와 BigTable의 차이점은 무엇입니까?

제휴 네트워크를 개발해야합니다 (따라서 클릭 수와 '매출'을 추적해야합니다). 그래서 bigQuery가 더 나은 API로만 bigTable 인 것처럼 보이기 때문에 차이점에 대해 혼란스러워합니다.

+0

나는 BigTable이 더 나은 성능을 필요로하는 사람들을 위해 저수준 및 덜 관리되는 Cloud Datastore와 같다고 말하고 싶습니다. – dyeray

+0

이 과거의 SO 스레드가 도움이 될 수도 있습니다. http://stackoverflow.com/questions/34437572/google-bigtable-vs-bigquery-for-storing-large-number-of-events –

+0

@dyeray 예 알아요.하지만 거기에 있습니다. BigQuery 대신 BigTable과 BigQuery에서 동일한 데이터를 유지해야하는 이유는 무엇입니까? –

답변

13

의 차이는 기본적으로 이것이다 :

의 BigQuery는 추가하여 많이 변경되지 않는 데이터 세트, 또는 변경에 대한 쿼리 엔진입니다. 쿼리에 "테이블 스캔"이 필요하거나 전체 데이터베이스를 조사해야 할 때 훌륭한 선택입니다. 합계, 평균, 개수, 그룹을 생각하십시오. BigQuery는 많은 양의 데이터를 수집하고 이에 대해 질문 할 때 사용해야하는 기능입니다.

BigTable은 데이터베이스입니다. 대규모의 확장 가능한 응용 프로그램을위한 토대가되도록 설계되었습니다. BigTable을 사용하면 데이터를 읽고 쓰는 데 필요한 앱을 만들 때 규모가 문제가 될 수 있습니다. 귀하의 요구 사항이 라이브 데이터베이스 인 경우

+1

- 'BigTable 사용'을 의미 : o) –

+0

@MikhailBerlyant thanks, edited –

11

빅 테이블는 (비록 정말 OLTP 시스템을하지 않음)가 필요합니다 것입니다. 애널리틱스와 같은 목적이 있다면 BigQuery이 필요합니다.

OLTP와 OLAP를 생각해보십시오. 당신이 카산드라와 하둡을 잘 알고있는 경우 또는, 빅 테이블은 대략 카산드라 동일합니다,

https://cloud.google.com/images/storage-options/flowchart.svg

주 BigQuery를 대략 하둡 동일합니다 (합의하지 공정한 비교,하지만 당신은 아이디어를 얻을)

Bigtable은 관계형 데이터베이스가 아니며 SQL 쿼리 또는 JOIN을 지원하지 않으며 다중 행 트랜잭션을 지원하지 않습니다. 또한 소량의 데이터에 대해서는 좋은 솔루션이 아닙니다. RDBMS OLTP가 필요한 경우 cloudSQL (mysql/postgres) 또는 스패너를 살펴야 할 수도 있습니다.

구글 구름이

enter image description here

비용 측면

https://stackoverflow.com/a/34845073/6785908을 제공하는 다른 데이터 저장소간에 결정에 조금 도움이 될 수 있습니다. 여기에 관련 부품을 인용하십시오.

전체 비용은 얼마나 자주 데이터를 쿼리 할 것인가에 달려 있습니다. 백업이고 너무 자주 이벤트를 재생하지 않으면 먼지가 저렴합니다. 그러나 매일 한 번 재생해야하는 경우 을 시작하여 5 $/TB가 매우 쉽게 스캔됩니다. Google은 저렴한 인서트 및 스토리지가 얼마나 유용했는지에 놀랐지만, Google은 값 비싼 쿼리를 어느 시점에 실행해야하기 때문에 이것이 ofc입니다. 당신은 몇 가지 주위에 디자인해야합니다. 예 :AFAIK 스트리밍 삽입물은 테이블에 기록 할 수있는 보장이 없으며 실제로 작성된 것인지 확인하기 위해 목록의 꼬리 부분을 자주 폴링하기 위해 이 있습니다. 시간 범위 테이블 데코레이터 인 으로 꼬리표를 효율적으로 처리 할 수 ​​있지만 (전체 데이터 세트를 스캔하는 데 비용을 지불하지 않음).

주문에 신경 쓰지 않는다면 무료로 테이블을 나열 할 수도 있습니다. 아니 '쿼리'를 실행해야합니다.

편집 한

클라우드 스패너는별로 멀리 CAP 정리를 무시하는 유일한 데이터베이스입니다, 상대적으로 젊은이지만, 매우 강력하고 유망하다. 이 기능은 두 세계의 최고 (전통적인 RDBMS와 NoSQL에를)하다의

enter image description here

내가 대답하기 조금 늦게 알아,하지만 그것은 미래에 다른 사람을 도움이 될 수 있습니다 넣다에 추가.

관련 문제