2014-12-08 2 views
4

나는 json 인 "iplRDD"를 가지고 있으며 아래 단계를 수행하고 hivecontext를 통해 쿼리합니다. 결과는 얻지 만 항목 헤더는 사용하지 않습니다. 값과 함께 열 이름을 가져 오는 방법이 있습니까?hiveContext를 사용하여 열 이름을 가져 오는 방법이 있습니까?

val teamRDD = hiveContext.jsonRDD(iplRDD) 
teamRDD.registerTempTable("teams") 
hiveContext.cacheTable("teams") 

val result = hiveContext.sql("select * from teams where team_name = "KKR") 
result.collect.foreach(println) 

아무 생각하세요?

답변

2

teamRDD.schema.fieldNames에는 헤더 이름이 포함되어야합니다.

1

당신이 CSV 파일로 헤더와 같은 당신의 dataframe '결과'를 저장할 수 있습니다..

result.write() 형식 ("com.databricks.spark.csv") 옵션 ("헤더" "true"). save (outputPath);

1

당신은 사용하여 얻을 수 있습니다 :

result.schema().fields(); 
관련 문제