2012-03-30 3 views
3

어떤 작업을 수행해야합니까 에 HBase를 사용 하시겠습니까?HBase Anti-Patterns

HBase와 HDFS는 transient 데이터 저장소로 처리해야하며지도/축소 작업에 필요한 데이터 만 보유해야합니다.

정식 데이터 저장소로 HBase를 사용하는 것은 적절하지 않습니까? 랜덤 액세스 대기 시간 스파이크는 어쨌든이 방법을 사용하지 못하게하지만 캐싱 및 기타 악영향을 완화 할 수 있습니다.

+0

당신은 그 이해를 무엇입니까? –

+0

HDFS는 특히 랜덤 액세스가 빠르지 않지만 대용량 파일을 스트리밍하는 데 적합합니다. 또한 분산 된 특성은 맵/리덕션 작업에 적합하며, 많은 수의 동시 읽기를 읽을 수있는 작업에 '근접'할 수 있습니다. –

답변

2

HBase는 (많은 Google 서비스에서 많이 사용되는 Big Table과 같은) 정식 데이터 저장소로 사용되기로되어 있습니다. HDFS는 MapReduce 용으로 제작되었지만 HBase는 MapReduce 이상을 허용하는 HDFS를 기반으로합니다. HBase는 실제로 데이터베이스입니다.

전통적인 관계형 데이터베이스 시스템보다 HBase를 선택해야하는 주된 이유는 입니다. 빅 데이터가 없으면 HBase를 사용하지 마십시오. 응용 프로그램에 많은 조인이 필요하고 SQL과 같은 쿼리 언어가 필요하며 전 세계에서 데이터 확장이 필요하지 않은 경우 RDBMS를 선호합니다.

반면에 관계형 데이터베이스에 많은 수의 NULL 항목이있는 경우 HBase는 스파 스이므로 좋은 대안입니다. 즉, NULL을 저장하지 않습니다.