질문이 있습니다. BigQuery에 데이터를로드하는 Databricks에 ETL이 내장되어 있지만 각 ETL을 실행하기 전에 BigQuery 테이블을 지우려는 경우 가능합니까? 초보자 질문에 대해 유감스럽게 생각합니다! 감사!!!Spark ETL에서 BigQuery 테이블 재설정
답변
당신은 어떻게 테이블이로드 무슨 일하고 제어하는데 유용하다 jobs.insert의 configuration.load 속성에서 사용 가능한 데이터 두 가지 속성이 (많은 다른 사람의 사이에서) 거기를로드 할 때로 :
configuration.load.writeDisposition
[선택 사항] 대상 테이블이 이미있는 경우 발생하는 작업을 지정합니다.
다음 값이 지원됩니다.
WRITE_TRUNCATE : 테이블이 이미 존재하면 BigQuery가 테이블 데이터를 덮어 씁니다. WRITE_APPEND : 테이블이 이미 존재하면 BigQuery는 데이터를 테이블에 추가합니다.
WRITE_EMPTY : 테이블이 이미 있고 데이터가있는 경우 작업 결과에 '중복'오류가 반환됩니다.
기본값은 WRITE_APPEND입니다.각 작업은 기본적이며 BigQuery가 작업을 성공적으로 완료 할 수있는 경우에만 발생합니다. 생성, 절단 및 추가 작업은 작업 완료시 하나의 원자 적 업데이트로 발생합니다.
및
configuration.load.createDisposition
[선택 사항] 작업이 새 테이블을 만들 수 있는지 여부를 지정합니다.
다음 값이 지원됩니다.
CREATE_IF_NEEDED : 테이블이 없으면 BigQuery가 테이블을 만듭니다.
CREATE_NEVER : 테이블이 이미 존재해야합니다. 그렇지 않은 경우 작업 결과에 'notFound'오류가 반환됩니다.
기본값은 CREATE_IF_NEEDED입니다.작성, 절단 및 추가 작업은 작업 완료시 하나의 원자 적 업데이트로 발생합니다.
그래서, WRITE_TRUNCATE
는
- 1. Spark AVRO with BigQuery
- 2. Spark BigQuery Connector 대 파이썬 BigQuery 라이브러리
- 3. Spark on YARN 및 spark-bigquery 커넥터
- 4. ETL에서 테이블 조인으로 데이터 캡처 변경
- 5. 스트림의 BigQuery 테이블/
- 6. bigquery 자동 업데이트 테이블
- 7. Spark BigQuery Connector를 로컬에서 사용하는 방법은 무엇입니까?
- 8. ETL에서 ELT로 이동 하시겠습니까?
- 9. 시간이 분할 된 BigQuery 테이블
- 10. BigQuery 테이블 존재 여부 확인
- 11. BigQuery 쿼리 제한 테이블 수
- 12. Cloud SQL에서 BigQuery 테이블 쿼리
- 13. 의 BigQuery : 잘못된 테이블 ID
- 14. Python API로 Bigquery 테이블 만들기
- 15. Bigquery Shard 대 Bigquery 파티션
- 16. ETL에서 증분 데이터를 테스트하는 방법
- 17. DataTables : 테이블 데이터 재설정
- 18. Oracle 플래시백 테이블 재설정
- 19. GWT 셀 테이블 재설정
- 20. SparklyR Spark Context에서 테이블 제거
- 21. BigQuery - 대형 테이블 조인 및 피벗
- 22. 쿼리 성능에 영향을주는 BigQuery 테이블 속성
- 23. google-bigquery 야간 테이블 복사 예약
- 24. Google genomics bigQuery 차이 테이블 데이터 설명
- 25. 로드 작업 후 오래된 BigQuery 테이블
- 26. BigQuery 테이블 스키마에 중첩 필드를 추가하려면 어떻게해야합니까?
- 27. BigQuery 테이블 데이터에 대한 가격 결정
- 28. 의 BigQuery 가격 - 당 두 개의 테이블
- 29. JSQ 형식의 데이터를 읽는 BigQuery 테이블 URL
- 30. BigQuery Python API 가져 오기 테이블