2017-03-01 6 views
2

저는 Spark Java를 이렇게 생겼습니다. 코드는 JDBC를 사용하여 Oracle 테이블에서 데이터를 가져오고 groupby 출력을 표시합니다. 내가 코드를 실행 Spark DataFrame groupBy

DataFrame jdbcDF = sqlContext.read().format("jdbc").options(options).load(); 
jdbcDF.show(); 
jdbcDF.groupBy("VA_HOSTNAME").count().show(); 

Long ll = jdbcDF.count(); 
System.out.println("ll="+ll); 

, jdbcDF.show();groupBy 반면, 작업 및 아무것도 인쇄되지 않습니다 카운트 오류가 발생되지 않았다됩니다.

제 열 이름이 정확합니다. 그 열을 인쇄 해 보았는데 효과가 있었지만, groupBy 때 작동하지 않습니다.

누군가 DataFrame 출력을 도와 줄 수 있습니까? 나는 불꽃 1.6.3을 사용하고있다.

답변

1

당신이 시도 할 수

import org.apache.spark.sql.functions.count 

jdbcDF.groupBy("VA_HOSTNAME").agg(count("*")).show()