2016-09-09 2 views
0

프로젝트와 관련된 연구 단계에 있으며, 대상과 관련된 개체 수를 쿼리하여 개체 (예 : 전자 메일 주소 또는 전화 번호)를 식별/선택합니다. 각 개체와 함께. 주어진 속성 값에 대한 EMAIL_ID을 검색 한 후 쉽게NoSQL DBMS가 희소 속성으로 데이터를 쿼리하고 교차합니다.

CREATE TABLE data (
    property text, 
    property_value text, 
    email_id int, 
    PRIMARY KEY (property, property_value) 
) WITH COMPACT STORAGE; 

:

첫째, 내가 좋아하는 뭔가, 카산드라의 생각했다.

하지만 여러 속성과 값으로 데이터를 쿼리해야합니다. 교차를 통해 클라이언트 쪽에서 처리하는 것이 가능하다는 것을 알고 있지만, 교차하는 행이 수백만 개가 될 수 있으므로 매우 효율적이지 않습니다.

이러한 종류의 쿼리를 실행하는 올바른 방법과 기술은 무엇입니까?

답변

0

C *가 스파 스 데이터 테이블 (동적으로 열을 추가 할 수 있음)을 제대로 지원하더라도 쿼리 모델이 적합하지 않은 것으로 보입니다. 대신 관계형 데이터베이스에 적합 할 수 있습니다.

+0

필자는 저의 생각으로는 EAV 테이블 모델로 귀결됩니다.이 모델은 정말 효율적이지 않습니다 ... 아니면 잘못된 것입니까? –

+0

실제로. 조회 할 대상/방법을 알아야하며 모델 주위에 모델 (의도 한 말장난)이 있습니다. – xmas79

+0

잘 알려진 것과 잘 알려져있는 것은 "주어진 [값 | 값 집합]을 사용하여 다음 특성의 [모든 |]에 쌍을 이루는 모든 전자 메일을 제공하십시오"라는 단순한 모델입니다. 필연적으로 교차 수 및/또는 합집합으로 구성된 질의로 이어집니다. 또한 sharding을 사용하고 싶습니다. 따라서 가상화 인프라의 나머지 용량을 사용하는 것이 더 쉽기 때문에 큰 대신 작은 "작은"VM을 사용할 수 있습니다. –

관련 문제