2017-12-14 1 views
-1

숫자 열이있는 pyspark 데이터 프레임이 있습니다. 그 열을 합친 다음 결과를 파이썬 변수의 int로 반환해야합니다.PySpark - 데이터 프레임의 열을 합친 다음 결과를 int로 반환합니다.

df = spark.createDataFrame([("A", 20), ("B", 30), ("D", 80)],["Letter", "Number"]) 

나는 열을 더하기 위해 다음을 수행한다.

df.groupBy().sum() 

하지만 데이터 프레임이 다시 나타납니다.

+-----------+ 
|sum(Number)| 
+-----------+ 
|  130| 
+-----------+ 

나는 프로그램에서 어디에서 사용할지 다른 변수에 저장되는 int로 반환됩니다.

result = 130 

답변

0

다음 작업을해야합니다 :

df.groupBy().sum().rdd.map(lambda x: x[0]).collect() 
관련 문제