2
.tar.gz
파일에 큰 .csv
파일이 저장되어 있으며 하이브 테이블에 내용을 넣으려고합니다. 아쉽게도 .csv
파일의 압축을 풀기에 충분한 디스크 공간이 없습니다..tar.gz 파일의 큰 .csv 파일을 하이브 테이블에로드하십시오.
나는 다음과 같은 시도 (다음과 같은 변형) 한 :
Set Hive.exec.compress.output = true;
Set io.seqfile.compression.type = block;
DROP TABLE IF EXISTS db.test;
CREATE TABLE db.test
(var1 STRING, . . . varn STRING)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ','
FIELDS TERMINATED BY '\n';
create table test_seq
stored as sequencefile as
select * from test ;
LOAD DATA LOCAL INPATH '/home/db/test.tar.gz' INTO TABLE db.test;
create table test_seq
stored as sequencefile as
select * from test;
SELECT * FROM test LIMIT 10;
그러나 결과 테이블은 NULL 값을 포함합니다. 어떤 제안?
* 왜 * 이것이 OP 문제를 해결할 수 있습니까? –