2012-05-11 4 views
3

Google BigQuery가 기본 JSON 지원을 구현할 계획이 있습니까?BigQuery를위한 기본 JSON 지원?

하이브 데이터 (~ 20T)를 Google BigQuery, 으로 마이그레이션하는 것을 고려하고 있지만 하이브의 테이블 정의에 BigQuery에서 지원되지 않는지도 유형이 포함되어 있습니다. 이 정규 표현식을 사용하여 해결할 수 있습니다,하지만

select gid, payload['src'] from data_repository; 

: 아래의 예를 들어

의 HiveQL.

+0

그냥 머리까지, 우리는 JSON 데이터 섭취에 대한 지원을 시작했으며, 수출 형식으로 (참조 : googledevelopers.blogspot.com /2012/10/got-big-json-bigquery-expands-data.html) –

답변

0

가장 좋은 방법은 가져 오기 전에 모든 유형을 csv로 강요하고 복잡한 필드가있는 경우 쿼리의 정규 표현식을 통해 해당 필드를 분해하는 것입니다 (제안 된대로).

즉, 우리는 적극적으로 새로운 입력 형식에 대한 지원을 조사하고 있으며 어떤 형식이 가장 유용할지에 대한 피드백에 관심이 있습니다. 하이브 맵 유형과 비슷한 유형의 기본 쿼리 엔진 (Dremel)이 지원되지만 BigQuery는 현재 중첩 된 레코드를 처리하는 메커니즘을 노출하지 않습니다.

3

2012 년 10 월 1 일부터 BigQuery는 가져 오기 및 내보내기를 위해 개행으로 구분 된 JSON을 지원합니다.

블로그 게시물 : 데이터 형식에 http://googledevelopers.blogspot.com/2012/10/got-big-json-bigquery-expands-data.html

문서 : https://developers.google.com/bigquery/docs/import#dataformats

+0

하지만 오늘부터'[*]'처럼 기본 JSON 경로 연산이 빠져 있습니다 : http://stackoverflow.com/questions/ 28719880/bigquery-jsonpath-json-array 값 –