나는 데이터 프레임 자바에서 이런 식으로 저장하면 ... : 다수의 파일과hadoopish 폴더에서 마루 파일을로드하는 방법
df.write().parquet("myTest.parquet");
..., 다음은 hadoopish 방법에 저장됩니다 (폴더).
데이터 프레임을 단일 파일로 저장할 수 있습니까? collect()
을 시도했지만 도움이되지 않습니다.
load_df = sqlContext.read.parquet("myTest.parquet").where('field1="aaa"').select('field2', 'field3').coalesce(64)