Scala에서 Xml로드를 사용하여 XML 파일을 구문 분석하려고합니다. 그러나이 프로그램은 HDFS에서 입력 데이터를 읽을 수 없습니다. 로컬 파일 시스템에서만 읽을 수 있습니다.scala를 사용하여 HDFS에서 입력 xml 데이터 읽기
HDFS에서 입력 데이터를 읽는 방법을 알려주세요.
은 아래의 프로그램을 시도 : 사전에
import org.apache.spark.SparkConf
import org.apache.spark.SparkContext
import scala.collection.mutable.WrappedArray
import scala.collection.immutable.HashMap
import scala.collection.immutable.HashMap
import scala.collection.immutable.HashMap
object ProcessxmlInputFiles {
def main(args: Array[String]) {
val sc = new SparkContext(new SparkConf().setAppName("Parse XML Data").setMaster("local[*]"))
val rawRDD = xml.XML.load(args(0))
rawRDD.child.foreach { x =>
var dateTime = StringBuilder.newBuilder
x.child.foreach { x =>
if ("header".equals(x.label)) {
dateTime.append(x.child(1).attribute("dateTime").get.toString())
}
...
}
...
}
...
sc.stop
}
}
감사합니다!
인수로 귀하의 의견은 무엇인가에 대한 databricks lib 디렉토리를 사용할 수 있습니까? – FaigB