파일 데이터 스트림을 처리하여 단어 수를 계산하는 스파크 스트리밍 응용 프로그램을 실행하려고합니다. 내가 읽고있는 디렉토리는 Windows입니다. 위와 같이 "Users/Name/Desktop/Stream"과 같은 로컬 디렉토리를 사용합니다. HDFS가 아닙니다. 데스크톱에서 "스트림"으로 폴더를 만들었습니다. Spark Streaming 응용 프로그램을 시작한 후 일부 텍스트 파일을 'Stream'폴더에 추가했습니다. 하지만 내 스파크 응용 프로그램은 파일을 읽을 수 없습니다. 항상 빈 결과를 제공합니다. 내 코드는 다음과 같습니다.Windows에서 StreamingContext.textFileStream의 올바른 디렉토리 경로 형식은 무엇입니까?
//args(0) = local[2]
object WordCount {
def main(args: Array[String]) {
val ssc = new StreamingContext(args(0), "word_count",Seconds(5))
val lines = ssc.textFileStream("Users/name/Desktop/Stream")
val words = lines.flatMap(_.split(" "))
val wordCounts = words.map(x => (x, 1)).reduceByKey(_ + _)
wordCounts.print()
ssc.start()
ssc.awaitTermination()
}
}
출력 : 얻기 빈 데이터 나뿐만 아니라 C:/Users/name/Desktop/Stream
과 경로를 제공하려고 매 5 초마다
17/05/18 07:35:00 INFO Executor: Running task 0.0 in stage 71.0 (TID 35)
-------------------------------------------
Time: 1495107300000 ms
-------------------------------------------
은 - 여전히 같은 문제와 응용 프로그램이 파일을 읽을 수 없습니다.
잘못된 디렉토리 경로를 알려주는 사람은 누구나 안내 할 수 있습니까?
을 당신이 말한, 아래에 오류가 발생했습니다 17/05/18 09:28:44 WARN FileInputDStream : 새 파일을 찾는 중 오류가 발생했습니다. 잘못된 FS : file : // C :/Users/SRIKANTH/Desktop/Stream, 예상 : file : /// – Ramesh
'file : //'을'file : ///'을 사용하도록 바꾸고 새로운 파일을 추가 할 수 있습니까? –
val line = ssc.textFileStream ("file : /// C :/Users/name/Desktop/Stream") 경로를 수정했습니다. 여전히 같은 문제입니다. 빈 결과 제공. – Ramesh