2014-10-21 2 views
4

저는 BigQuery 데이터를 Pandas로 내보내는 방법을 연구했습니다. 두 가지 방법이 있습니다 :Google BigQuery 데이터를 Python Pandas 데이터 프레임으로 내보내기

  1. 내보내기 파일 CVS에가와로드 -

  2. https://cloud.google.com/bigquery/exporting-data-from-bigquery 직접 팬더 프레임에 데이터를 당깁니다. 이 방법은 작동하지 않지만 pandas.io.gbq.read_gbq (query, project_id = None, index_col = None, col_order = None, reauth = False) 메서드가 있습니다. gbq가 단종 된 것으로 보입니까?

누군가가이 문제를 가장 효율적으로 해결할 수있는 방법을 제안 할 수 있습니까?

감사합니다.

+0

어떤 팬더 버전을 사용하고 있습니까? 그것은 여전히 ​​0.15.0에있는 것처럼 보입니다. http://pandas.pydata.org/pandas-docs/stable/generated/pandas.io.gbq.read_gbq.html –

+0

예, 정확하게 사용하고 있습니다. 여전히 성공하지 못했습니다. 다른 제안? – BlackHat

답변

7

gbq.read_gbq 방법은 .14.0-1에서 확인 (Windows 7)으로 업그레이드했을 때 팬더 .15.0-1에서 확실히 작동합니다. Python을 사용하는 경우 데이터 분석을 Google BigQuery에서 데이터 프레임으로 가져 오는 것이 좋습니다. 이는 거의 모든 분석 작업에 사용됩니다.

더 많은 정보없이 문제를 극복하는 방법은 어렵지만 Google 계정에 로그인 된 브라우저에서 인증 절차가 완료되었는지 확인한 다음 문제를 해결하는 것으로부터 시작합니다. 첫 번째 인증 플로우 (oauth2client.tools.run)에 대해 비추천 경고가 있지만 모든 것이 여전히 작동합니다. 그 외에는

, 여기 예제를 다음 시도 할 것입니다 : http://pandas-docs.github.io/pandas-docs-travis/io.html#io-bigquery

참고로, 현재 dev에 지점에, Gcloud 인증을위한 옵션이 헤드리스 (headless) 인증을보다 편리하게 추가되고있다.

관련 문제