내 프로젝트에서 나는 3 개의 입력 파일을 가지고 있으며 파일 이름을 args (0)로 args (2)로 만들고, 출력 파일 이름은 args (3)로, 소스 코드에서 로그에 내가 아무것도 할스파크에서 saveAsTextFile 메서드
val sc = new SparkContext()
var log = sc.textFile(args(0))
for(i <- 1 until args.size - 1) log = log.union(sc.textFile(args(i)))
사용하지만
log.coalesce(1, true).saveAsTextFile(args(args.size - 1))
를 사용하여 텍스트 파일로 저장하지만 여전히 일부-00001, 파트 00000으로 3 파일에 저장 부분-00002, 3 가지 입력 파일을 출력 파일에 저장할 수있는 방법이 있습니까?
전체 프로그램입니까? 괜찮아 보이는데, 출력 디렉토리에'part-00000'과'_SUCCESS' 파일 하나가 있어야합니다. 'saveAsTextFile'에 대한 인수는 실제로 출력이 저장되는 디렉토리 이름입니다. – lpiepiora
답장을 보내 주셔서 감사합니다. 사실 나는 로그에 어떤 행동을한다. 지금 당장 시도해 보니 유용 할 것입니다. 아마도 내 프로젝트에 뭔가 오류가 있습니다. 나는 그것을 보게 될 것입니다! – kemiya
방금이 작업을 직접 시도했지만 출력이 하나 밖에 없습니다. 로컬 또는 클러스터에서 스파크를 실행하고 있습니까? – climbage