1
나는 스파크와 hbase를 사용하여 Rdd를 얻고있다. 이제 그 rdd를 필터링하고 그 Rdd에서 특정 값을 얻고 싶습니다. 어떻게 진행할 수 있습니까? 여기Spark Hbase Rdd를 필터링하고 결과를 얻는 방법은 무엇입니까?
내가 지금
val sc = new SparkContext(sparkConf)
val conf = HBaseConfiguration.create()
conf.set(TableInputFormat.INPUT_TABLE, "tbl_date")
val hBaseRDD = sc.newAPIHadoopRDD(conf, classOf[TableInputFormat],
classOf[ImmutableBytesWritable],
classOf[Result])
지금 내가 RDD (hBaseRDD)과는 RDD에 특정 매개 변수를 전송하여 특정 열 데이터를 얻을 사용하고자까지 한 일이다. 내가 어떻게 이걸 얻을 수 있니?