2017-03-17 8 views
4

I 즉 Id, First Name, Last Name아파치 스파크 AGG Dataframe GROUPBY()

I는 Id에 기초 GroupBy를 적용하고 싶은 목록으로 First Name, Last Name 열을 수집하고자하는 DataFrame 3 열을 갖는다.

예 : -이

+---+-------+--------+ 
|id |fName |lName | 
+---+-------+--------+ 
|1 |Akash |Sethi | 
|2 |Kunal |Kapoor | 
|3 |Rishabh|Verma | 
|2 |Sonu |Mehrotra| 
+---+-------+--------+ 

같은 DF를하고 난 사전이

+---+-------+--------+--------------------+ 
|id |fname   |lName    | 
+---+-------+--------+--------------------+ 
|1 |[Akash]   |[Sethi]    | 
|2 |[Kunal, Sonu] |[Kapoor, Mehrotra] | 
|3 |[Rishabh]  |[Verma]    | 
+---+-------+--------+--------------------+ 

감사처럼 내 출력이

답변

2

당신은 다음과 같은 여러 열을 집계 할 수 원하는 :

df.groupBy("id").agg(collect_list("fName"), collect_list("lName")) 

예상 결과가 나옵니다.