CDH3에서 CDH4로 마이그레이션 할 계획입니다.이 마이그레이션의 일환으로 HBASE를 CDH3의 데이터로 업데이트하기 때문에 시스템을 외부로 가져올 계획입니다. 웨어 하우스로 하이브를 사용하고 있습니다.하이브리드 테이블 파티션과 마찬가지로 Hbase 테이블에서 파티션을 만드는 방법
마이그레이션에서 중요한 문제가 발생했습니다. Hive는 파티션을 테이블로 지원합니다. 그리고 우리 시스템에는 다른 스키마에 많은 테이블이 있으며 일부 테이블에는 날짜 기반의 파티션이 있습니다. 우리는 지난 5 년간의 데이터 기록을 가지고 있습니다 (일부 테이블에는 365 * 5 파티션이 있음).
우리는 HBase에서 파티션을 만들기위한 솔루션을 찾지 못했습니다. 이 파티션을 구현할 때 HBase의 테이블 생성을 도와 줄 수있는 사람이 있습니까?
우리가 HBASE로가는 이유는 업데이트를 지원하기 때문입니다.
HBASE가 다른 것을 지원하지 않는 경우 (MangoDB와 마찬가지로 Cassandra) 우리 행동을 지원합니다.
우리가 솔루션을 둘러싼 몇 가지 작업을 찾을 수 있다면 정말 큰 도움이됩니다.
답장을 보내 주시면 감사하겠습니다. 그러나 언젠가는 거의 10 + 수백만 개의 레코드가 있으므로 하루에 파티션을 만들고 싶습니다. 컬럼 패밀리는 좋은 디자인이 아닙니다. 우리는 각 스키마에 대해 현명한 파티션을 찾고 있습니다. 어떤 방법이 있습니까? – GHK
좋은 지적. 나 한동안 생각하게 해줘. – Tariq
이러한 레코드 각각을 행으로 푸시하면 행 아웃 키가 특정 날짜로 시작되는 캐치는 무엇입니까? – Tariq