2016-11-10 2 views
0

푸른 하늘에 두 개의 클러스터가 있으며, 하나는 스파크 2.0에, 다른 하나는 hbase에 있습니다. 필자는 hbase를 완벽하게 채울 수 있습니다. 이제 hbase에 스파크를 연결하고 몇 가지 계산을 수행하려고합니다. 나는 scala를 모른다는 이유로 파이썬을 사용하고 싶다.pyspark에서 hbase로 연결하는 방법

첫 번째 질문은 무엇입니까? 그것을 수행하는 가장 좋은 방법은 무엇입니까? 스파크 -> 하이브 -> hbase 또는 직접 hbase 스파크?

삽입 및 쿼리에 대한 좋은 예가 있습니까?

고마워요?

+1

왜 하이브를 통과하고 싶은지 잘 모르겠습니다. 스파크 Hbase 커넥터에 문제가 있습니까? –

+0

아무 문제가 없습니다. 내 문제는 좋은 예제와 파이썬에 대한 커넥터를 찾을 수 없다는 것입니다. 어쩌면 나는 좋은 하루를 인터넷으로 검색하지 않고있다. –

+0

그래, 나는 단지 스칼라 예제를 발견했다. hbase python 라이브러리가 있습니다. 그래서 여러분은 단지 병렬 처리를위한 스파크를 원한다고 가정합니다. –

답변

관련 문제