0

저는 아파치 스파크를 처음 접했고 스파크 스트리밍과 카프카 통합을 포함하는 트위터 데이터에 대한 정서 분석과 관련된 프로젝트를 진행해 왔습니다. 사용 나는 마지막 단계에서,스파크 스트리밍 및 카프카 통합

https://github.com/sridharswamy/Twitter-Sentiment-Analysis-Using-Spark-Streaming-And-Kafka 그러나 GitHub의 코드 (아래 제공된 링크) 다음이었다, 즉 아파치 스파크와 카프카의 통합시이며, 다음과 같은 오류가 얻었다

py4j.protocol.Py4JError: An error occurred while calling o24.createDirectStreamWithoutMessageHandler. Trace: 
py4j.Py4JException: Method createDirectStreamWithoutMessageHandler([class org.apache.spark.streaming.api.java.JavaStreamingContext, class java.util.HashMap, class java.util.HashSet, class java.util.HashMap]) does not exist 
    at py4j.reflection.ReflectionEngine.getMethod(ReflectionEngine.java:318) 
    at py4j.reflection.ReflectionEngine.getMethod(ReflectionEngine.java:326) 
    at py4j.Gateway.invoke(Gateway.java:272) 
    at py4j.commands.AbstractCommand.invokeMethod(AbstractCommand.java:132) 
    at py4j.commands.CallCommand.execute(CallCommand.java:79) 
    at py4j.GatewayConnection.run(GatewayConnection.java:214) 
    at java.lang.Thread.run(Thread.java:745) 

명령 : bin/spark-submit --packages org.apache.spark:spark-streaming-kafka_2.10:1.5.1 twitterStream.py

아파치 스파크 버전 : 스파크 2.1.0 - 빈 - hadoop2.4

카프카 버전 : kafka_2.11-0.10.1.1

나는 이것을 디버깅 할 수 없었고 어떤 도움을 주시면 감사하겠습니다.

답변

0

실행하려는 예제가 1.5로 실행되도록 설계되었습니다. spark 1.5.0을 다운로드하거나 spark-submit을 spark 2.1.0에서 실행하고 kafka 패키지를 2.1.0과 관련시켜야합니다 (예 : ./bin/spark-submit --packages org.apache.spark:spark-streaming-kafka-0-8_2.11:2.1.0).

+0

안녕하세요. 그것은 매력처럼 작동했습니다. –

관련 문제