2016-09-15 3 views
0

그래서 나는이 질문과 동일한 제목이 동안 : PySpark reduceByKey on multiple valuesPySpark reduceByKey이

내가 대답은 내가 원하는 것을 위해 동작하지 않습니다 수 있습니다.

name 'x' is not defined 

여기 세드릭 :

A = sc.parallelize([("a", (1,0)), ("b", (4,2)),("a", (11,2)), ("b", (4,10))]) 
A.reduceByKey(lambda x, y: x[0]+y[0],x[1]+y[1]).collect() 

내게 오류를 준다?

답변

0

문제점을 발견했습니다. 일부 괄호 :

A.reduceByKey(lambda x, y: (x[0]+y[0] ,x[1]+y[1])).collect()