아카이브의 압축을 풀지 않고 java의 아카이브에서 .tsv 파일 가져 오기

-2

8 개의 .tsv 파일을 포함하는 _2016_08_17.zip 파일이 있습니다. hit_data.tsv이라는 파일의 압축을 풀고 bigquery에 업로드해야합니다. 파일은 Google 클라우드 플랫폼의 버킷에 있습니다.아카이브의 압축을 풀지 않고 java의 아카이브에서 .tsv 파일 가져 오기

누군가 내게 아카이브를 열고 올바른 파일을 찾은 다음 행을 화면에 인쇄하는 간단한 프로그램을 제공 할 수 있습니까? 나는 거기에서 그것을 가져갈 수있다. 내 생각은 경로 gs://path_name/*hit_data.tsv을 hit_data.tsv 데이터가 들어있는 버퍼로 바꾸는 것입니다.

public static void main(String[] args) { 
    Pipeline p = DataflowUtils.createFromArgs(args); 

    p 
      .apply(TextIO.Read.from("gs://path_name/*hit_data.tsv")) 
      \\.apply(Sample.<String>any(10)) 
      .apply(ParDo.named("ExtractRows").of(new ExtractRows('\t', "InformationDateID"))) 
      .apply(BigQueryIO.Write 
        .named("BQWrite") 
        .to(BigQuery.getTableReference("ddm_now_apps", true)) 
        .withSchema(getSchema()) 
        .withWriteDisposition(BigQueryIO.Write.WriteDisposition.WRITE_APPEND) 
        .withCreateDisposition(BigQueryIO.Write.CreateDisposition.CREATE_IF_NEEDED)); 

    p.run(); 
}

출처

2016-08-17 Daniel Lee