Hibernate/pig 지원뿐만 아니라 mapreduce 프로그램을 사용하여 JSON 또는 CSV를 HBASE에로드하려고합니다. 가능한 것이고 어느 것이 더 효율적인 hive-hbase 또는 mapreduce- hbase.hbase에 json/csv를로드하려고합니다.
1
A
답변
0
아마도 대량로드를 참조 할 수 있습니다. 여기 링크가 있습니다. bulk loading
1
필자는이 작업을 위해 Perl 스크립트를 사용합니다.
이 내 (생성 된 펄) JSON 파일
{"c3":"c","c4":"d","c5":"tim","c2":"b","c6":"andrew","c1":"a"},"CURRENTLY20140131":{"c2":"tim2","c1":"bill2"},"THERE20140131"::{"c3":"c","c4":"d","c9":"bill2","c10":"tim2","c2":"b","c6":"andrew","c7":"bill","c5":"tim","c1":"a","c8":"tom"},"TODAY20140131":{"c2":"bill","c1":"tom"}}
나는 여러 열이 따라와 문자열에 샤딩을 나는 키 객체를 참조하는 것을 사람 /.
use strict;
use warnings;
use Data::Dumper;
use JSON::XS qw(encode_json decode_json);
use File::Slurp qw(read_file write_file);
my %words =();
my $debug = 0;
sub ReadHash {
my ($filename) = @_;
my $json = read_file($filename, { binmode => ':raw' });
%words = %{ decode_json $json };
}
# Main Starts here
ReadHash("Save.json");
foreach my $key (keys %words)
{
printf("put 'test', '$key',");
my $cnt=0;
foreach my $key2 (keys %{ $words{$key} }) {
my $val = $words{$key}{$key2};
print "," if $cnt>0;
printf("'cf:$key2', '$val'");
++$cnt;
}
print "\n";
}
Hbase 명령을 생성하고 실행하십시오.
Alternativly - 대용량 데이터 세트를 매우 빠르게로드하는 happybase (Python)도 있습니다.
희망이 .....
이 같은 출력을 생성해야하는 데 도움이
put 'test', 'WHERE20140131','cf:c2', 'bill2','cf:c1', 'tim2'
put 'test', 'OMAN20140131','cf:c3', 'c','cf:c4', 'd','cf:c5', 'tim','cf:c2', 'b','cf:c1', 'a','cf:c6', 'andrew'
put 'test', 'CURRENTLY20140131','cf:c2', 'tim2','cf:c1', 'bill2'
관련 문제
- 1. Hbase에 데이터로드
- 2. Java에서 hbase에 연결하지 못했습니다.
- 3. HBase에 SQL 함수 추가하기
- 4. HDFS는 HBase에 무엇을 제공합니까?
- 5. Docker에서 실행중인 HBase에 연결
- 6. HBase에 큰 삽입
- 7. HBASE에 datanucleus-rest 사용
- 8. csv 데이터를 Hbase에 로딩
- 9. Hbase에 Starbase 연결
- 10. Hbase에 목록 데이터 저장?
- 11. hbase에 데이터 쓰기
- 12. 클라이언트 컴퓨터에서 HBase에 연결
- 13. Hbase에 이미지 (얼룩)을로드하는 방법
- 14. Hadoop 엔진 내부에서 HBase에 액세스하기
- 15. 스칼라를 사용하여 Hbase에 삽입하는 문제
- 16. 자바 jdbc를 통해 HBase에 연결
- 17. hbase에 최대 버전 번호가 있습니까?
- 18. hbase.MasterNotRunningException Hbase에 테이블을 만들 때
- 19. Titan은 HBASE에 데이터를 저장하는 방법
- 20. hbase에 여러 개의 필터 지정
- 21. trafodion이 hbase에 연결할 수 없습니다.
- 22. Java로 localhost HBase에 연결하는 방법
- 23. HBASE에 연결하는 중 오류가 발생했습니다.
- 24. Hadoop - Mapper에서 직접 HBase에 쓰기
- 25. WildFly에서 HBase에 연결할 수 없습니다.
- 26. HBase에 입력 된 값 저장
- 27. Oozie를 사용하여 Hbase에 불꽃을 겁니다
- 28. Windows에서 HBase에 연결할 수 없습니다.
- 29. HBase에 JSON을 저장하고 Id로 쿼리하기
- 30. zohmg 데이터를 hbase에 가져올 때 문제가 발생했습니다.