스트리밍 데이터를 찾고 향상시키는 Spark 스트림 코드의 HBase 데이터를 읽고 싶습니다. spark-hbase-connector_2.10-1.0.3.jar
을 사용하고 있습니다. 내 코드에서스칼라에서 HBase 읽기 - it.nerdammer
다음 줄은
val docRdd =
sc.hbaseTable[(Option[String], Option[String])]("hbase_customer_profile")
.select("id","gender").inColumnFamily("data")
docRdd.count
오른쪽 수를 반환 성공한 것입니다.
docRdd
HBaseReaderBuilder (org.apache.spark.SparkContext @ 3a49e5, hbase_customer_profile, 일부 (데이터), WrappedArray (ID, 성), 없음, 없음,()리스트)
입니다
id, gender
열의 모든 행을 어떻게 읽을 수 있습니까? 또한 docRdd
을 데이터 프레임으로 변환하여 SparkSQL을 사용할 수 있습니다. 내가 행 키를 추가 한
case class Customer(rowKey: String, id: Option[String], gender: Option[String])
:
감사합니다. @ 베릴륨. 나는 이것을 시도 할 것이다. SparkStream에서 RDD를 사용하고 싶습니다. 나는 그것이 직렬화되기를 희망한다. 도움에 다시 한번 감사드립니다 –
이 질문에 대한 도움이 필요하십니까? – Beryllium
나는 이것 모두에 놓인다. 고맙습니다.. –