집계 된 로그에서 데이터를 검색하는 방법을 알고 싶습니다. 이것은 내가 무엇을 가지고 : - 30 기가 바이트 HDFS에로드 압축되지 않은 로그 데이터의 일상 (이것은 1백기가바이트에 대해 곧 성장할 것)에 대한 이 내 생각이다 : -이 데이터가 돼지 로 처리되어 매일 밤 - (로그 데이터를 무한대로 저장됩니다) HBase를에 로그 항목 및 하중이에서 -
zohmg 프로젝트가 죽은 것 같기 때문에 (2009 년 9 월 이후 새로운 커밋이 없음), 여러분 중 누군가가 성공적으로 사용했거나 사용했는지 알고 싶습니다. 또는이 프로젝트의 미래에 대해 아는 경우. 그렇지 않은 경우이 프로젝트에 대한 대안이 있습니까? 저는 (아파치) 로그 (Hadoop을 배치 처리 시스템으로 사용)에서 데이터를 추출하고 HBase에
HBase FAQ에서 읽은 첫 번째 샘플 스키마 중 하나는 수 많은 관계에 대한 학생 - 학습 사례입니다. 스키마에는 학생 테이블의 코스 열과 코스 테이블의 학생 열이 있습니다. 하지만 HBase에서 이러한 두 개체 간의 무결성을 보장하는 방법을 이해하지 못합니다. 한 테이블을 업데이트 할 때와 다른 테이블을 업데이트 할 때 사이에 충돌이 발생하면 문제가
zohmg를 사용하여 HBase에서 mapper, table을 성공적으로 생성하고 테스트 데이터를 가져 왔습니다 (--local 스위치 사용). 하지만 문제 HBase를로 매핑 한 후 내 데이터를 삽입이,이 내가 얻을 오류입니다 : Exception in thread "main" java.lang.RuntimeException: class org.apach
"사용자"가 있다고 가정 해보십시오. 열쇠 야. 그리고 "사용자 수"를 유지해야합니다. 키 "사용자"와 값 "0"을 "9999+ ;-)"(내가 가질 수있는만큼)로 녹음 할 계획입니다. Cassandra, HBase 또는 MySQL을 사용하면 어떤 문제가 발생합니까? 말하자면,이 "사용자"키에 대해 새 업데이트가 1,000 번 있습니다. 여기서 값을 증가시켜
나는 조언이 개 모순 된 부분을 본 것 (특히,하지만 난 그것뿐만 아니라 카산드라 적용 생각합니다.) 당신이 함께 집계됩니다 그룹 키를 종종 데이터 지역을 이용합니다. 그 일이 여러 컴퓨터에 분산 될 수 있도록 주위 확산 키 (화이트, 하둡은 확실한 가이드가 나는 ...을 HBase를 사이트에 그것을보고 기억합니다,하지만 그것을 찾을 수 없습니다) (Twi
의 행을 업데이트하는 동안 나는 샘플을 실행했습니다 열 가족 열 >create 'table1','column'
>put 'table1','row1','column:address','SanFrancisco'
hbase(main):020:0> scan 'table1'
ROW COLUMN+CELL
row1 column=co