0
파일을 스파크 스트리밍으로 사용하고 있습니다. 스트림의 단어 수를 계산하고 싶지만 애플리케이션에서 아무 것도 인쇄하지 않습니다. 내 코드는 여기에 있습니다. 나는filstream을 사용하는 스파크 스트리밍 단어 개수가 결과를 인쇄하지 않습니다.
import org.apache.spark.SparkConf
import org.apache.spark.streaming._
import org.apache.spark.streaming.StreamingContext
object TwitterHashtagStreaming {
def main(args: Array[String]) : Unit = {
val conf = new SparkConf().setAppName("TwitterHashtagStreaming").setMaster("local[2]").set("spark.executor.memory","1g");
val streamingC = new StreamingContext(conf,Seconds(5))
val streamLines = streamingC.textFileStream("file:///home/cloudera/Desktop/wordstream")
val words = streamLines.flatMap(_.split(" "))
val counts = words.map(word => (word, 1)).reduceByKey(_ + _)
counts.print()
streamingC.start()
streamingC.awaitTermination()
}
}
이
무엇이 인쇄됩니까? 오류가 있습니까? –
숫자가 비어있는 것처럼 시간이 없습니다. -------------------------------------- ----- 시간 : 1506415275000 ms --------------------------------------- ---- –
먼저 데이터가 읽혔는지 확인하기 위해 단어 수를 계산하기 전에 streamLines를 인쇄 해보십시오. –