2013-08-05 2 views

답변

5

저장하기 위해 HDFS에 아무 것도 저장할 수 있습니다. 하지만 그건 의미가 없습니다. 우선, Hadoop을 RDBMS (여기에서하려고하는 것)의 대체품으로 생각하지 않아야합니다. 둘 다 완전히 다른 목적으로 사용됩니다. Hadoop은 트랜잭션, 관계형 또는 실시간 요구 사항에 적합하지 않습니다. 오프라인 일괄 처리 요구를 처리하기위한 것이 었습니다. 따라서 유스 케이스를 적절히 분석 한 다음 결정을 멈추는 것이 좋습니다.

제안 사항으로는 Hive을 알려 드리고 싶습니다. 기존 Hadoop 클러스터 위에웨어 하우징 기능을 제공합니다. 또한웨어 하우스에 SQL과 같은 인터페이스를 제공하여 SQL 백그라운드에서 오는 경우 훨씬 쉽게 작업을 수행 할 수 있습니다. 그러나 하이브는 일괄 처리 시스템이기 때문에 실시간이 필요한 경우에는 적합하지 않습니다.

abhinav에서 제안한대로 HBase을 볼 수 있습니다. Hadoop 클러스터에서 실행될 수있는 DB이며 데이터에 대한 임의의 실시간 읽기/쓰기 액세스를 제공합니다. 그러나 NoSQL 데이터베이스라는 점을 명심해야합니다. SQL 용어 및 규칙을 따르지 않습니다. 그래서 처음에는 약간 외계인이라고 느낄 수 있습니다. RDBMS의 행 스타일 저장소와 달리 새 저장소 스타일 (기둥 형)에 데이터를 저장하는 방법과 같은 문제에 대해 생각해야 할 수도 있습니다. 그렇지 않으면 설정하고 사용하는 데 문제가되지 않습니다.

HTH

0

모든 파일을 HDFS에 저장할 수 있습니다. 하지만 SQL 형식의 DB를 원한다면 HBASE를 사용해야합니다. HDFS에 직접 데이터를 저장하면 합리성을 저장할 수 없습니다.

+1

HBase와 같은 기둥 형 스토리지에 관계형 데이터를 저장할 수있는 방법을 추가해야합니다. –

관련 문제