1
ETL 도구를 사용하지 않고 Hortonworks Hive에서 Apache Cassandra로 데이터를 내보내는 방법이 있습니까?Hive에서 Cassandra로 데이터를 내보내는 방법은 무엇입니까?
ETL 도구를 사용하지 않고 Hortonworks Hive에서 Apache Cassandra로 데이터를 내보내는 방법이 있습니까?Hive에서 Cassandra로 데이터를 내보내는 방법은 무엇입니까?
"내보내기"데이터베이스와 "myview"테이블을 만들 수 있습니다.
create database export;
use export;
create table myview as select <put your query here>
그런 다음 전체 디렉토리 경로를 얻기 위해 "내림차순"를 사용 :
디렉토리 경로에서describe myview.
, 당신은 HDFS 위치에 카산드라를 가리키고 HDFS에서 가져올 수 있습니다.
면책 조항 :이 프로세스는 "myview"가 분할되지 않았기 때문에 작은 테이블에만 적용됩니다. 파티션이 정의 된 큰 파티션에는 적합하지 않습니다.
위의 단계에서 명확하지 않습니다. 정교하게 제발 주시겠습니까? 위의 예에서 Hadoop과 Cassandra가 어떻게 연결되어 있습니까? 내보내기가 테이블이 아니므로 Hadoop 클러스터/하이브 테이블에서 Cassandra 테이블로 데이터를 전송하는 방법을 알고 싶습니다. – user3538348
내 대답은 : "그 지점에 카산드라를 가리킨다". – javadba
안녕하세요 javadba, 하이브에 데이터베이스를 만든 다음 '사용 내보내기'에서 필요한 데이터가있는 테이블을 만들었습니다. 이제 카산드라를 하이브로 향하게하는 방법? 둘 다 두 개의 다른 클러스터와 다른 시스템입니다. 그것들이 같은 기계에 있더라도 연결 방법을 모른다. hdfs 위치를 가리 키도록 cassandra에서 Google을 찾을 수 없습니다. 샘플 코드를 제공해 주시겠습니까? 나는 Github '캐산 드라 - 하이브 (casandra-hive)'스토리지 핸들러를 시험 중이다. 그러나 이들이 단순하다면 당신의 단계를 사용하고 싶습니다. 고맙습니다. – user3538348