흥미롭게도 내가 스트리밍하고있는 일련의 사전에서 k, v 쌍의 수를 확인하려면 수표로 쓰고 싶지만 할 수있는 것 같지 않습니다. 이.Spark 스트리밍 및 스트리밍 된 사전 작업 수행
lines = ssc.socketTextStream("127.0.0.1", 5006)
json_format = lines.flatMap(lambda recieved: json.loads(recieved))
dict_format = json_format.flatMap(lambda x : len(x)).reduce(lambda a, b: a+b)
예를 들어 나는 다음과 같은 오류가 발생합니다 :
File "/home/xx/spark-1.6.1/python/pyspark/rdd.py", line 1776, in combineLocally
merger.mergeValues(iterator)
File "/home/xx/spark-1.6.1/python/pyspark/shuffle.py", line 236, in mergeValues
for k, v in iterator:
TypeError: 'int' object is not iterable
나는 우리가 사전 일련의가 있다고 가정 할 수 있습니다 -이 고장이 json.loads()
에없는하지만이 간단한 길이를 취할 수없는 것.