0

제 질문에 관심을 가져 주셔서 감사합니다. 시작하기 전에 Hadoop & HBase가 새로 도입되었음을 알려드립니다. 지금까지 하둡은 매우 흥미롭고 앞으로 더 많은 기여를하고 싶습니다.hbase 테이블에 키 - 값 데이터를로드하는 방법은 무엇입니까?

주로 HBase의 성능을 향상시키는 데 관심이 있습니다. 그렇게하기 위해서, 나는 하나의 hbase 테이블을 만들었고, hbase 테이블에 데이터 행을 5000 (의 값만 '!'로 구분 된 값)으로 작성한 돼지 스크립트를 작성했다가 나중에 hive 테이블로이 h 기본 테이블을 매핑했습니다. 모든 일이 잘 지금 일하고있다 ...하지만 문제는 지금 키와 값을 모두 가지고있는 데이터를로드하려면 (예를 들어 key1 = 12! key2 = 13), 그래서 어떤 종류의 파싱 나는 그 키 - 값 쌍 데이터를 h 기본 테이블에 적절히로드하도록 선택할 수 있으며 h 기본 테이블에서 행 키의 중요성을 알려줘야한다.

그리고

A = LOAD를 다음과 같이 전 돼지 스크립트를 작성했다 '/ BULK_ARK_DATA /'PigStorage 사용 ('!') (ID AS : chararray, A : chararray, B : chararray C : chararray); 'hbase : // bulk_ark'안에 저장 org.apache.pig.backend.hadoop.hbase.HBaseStorage ( 'AF : a AF : b AF : c');

그래서 hbase 테이블에 키 값 데이터를로드하는 방법 ?????? 제발 날 대답 해주세요. ^^

답변

0

Hbase는 실제로 키 - 값 데이터 스토어 (코어의지도)입니다. 특별한 일을 할 필요는 없지만 테이블 스키마에 대해 잘 생각해보십시오. 당신의 특별한 경우에있어서, 당신의 첫 번째 부분을 키로, 두 번째 부분을 가치로 갖는 것은 어떻습니까? "cf : key1 => 12"와 같은 것

+0

Thanx Tariq :) 네, 저는 동의합니다. 그러나 줄의 각각에 다른 키 - 값이 생기면 여기에 의심의 여지가 있습니다. 그 경우 선택을 쓰는 방법 특정 가치에 대한 질문? File test.ark에 1) key = 12가 들어 있습니다. name = test 2) value = 14! id = 345 3) true = yes 그럼 이제 "id"에 대해 qury를 쓰고 싶다면 "id"에 대한 쿼리를 작성하는 방법 ??? u가 ID 키를 인식하지 못하면 2 번째 줄에만 입력됩니다. 내 편에서 사과 실제로보기의 시점에서 잘못된 경우 – MapReddy

+0

당신은 열 한정자 필터를 사용할 수 있으며 그것이 존재하는 모든 행에서 직접 'ID'열을 얻을 수 있습니다. – Tariq

관련 문제