2012-02-01 7 views
5

저는 Hadoop의 초보자입니다. 저는 HDFS가 대부분 "한 번 쓰고 언제든지 읽기"에 관한 것이라고 읽었습니다. HDFS에 저장된 파일을 수정해야하는 경우가 있습니다. 나는 이것을하는 어떤 방법이 있는지 연구하고있다.hadoop HDFS 파일 업데이트

제 질문은 HBase에 HDFS 파일을로드하고 수정 한 다음 HDFS에 다시 저장하고 원본 파일을 삭제하는 것입니다. 가능한 경우 알려 주시기 바랍니다.

답변

4

파일의 값을 업데이트해야하는 경우 HBase를 사용하는 것이 훨씬 좋습니다. MR 작업에서 TableInputFormat 및 TableOutputFormat을 통해 HBase 테이블을 계속 사용할 수 있습니다. 데이터를 추가하려면 hdfs append를 지원하는 hadoop 버전 (예 : 0.20.205.0)을 사용할 수 있습니다.

+0

감사합니다. 스티브. hbase를 사용하여 hdfs 파일에 randow를 쓰거나 추가 만 할 수 있습니까? –

+0

hbase의 레코드를 임의로 수정할 수 있습니다. –

+0

스티브 난 HDFS 파일을 통해 수있는 Hbase 테이블을 빌드했습니다. HDFS에서 변경 사항을 볼 수없는 간단한 'Put'명령으로 Hbase 레코드를 업데이트하려고했을 때? 자동 업데이트되지 않아야합니까? – Ragav

관련 문제