2013-04-01 2 views
1

트리 구조화 된 데이터를 처리하도록 설계된 데이터베이스를 찾고 있습니다. 나는 Neo4j를 들여다 보았는데 좋았지 만 샤딩을 실제로 지원하지는 않는다. 반면에 Couchbase는 실제로 데이터의 단일 트리 (내 이해)에서 빌드되지 않습니다.트리 구조화 된 데이터를위한 분산 데이터베이스?

데이터 트리는 이론적으로 서버간에 분할하기가 실제로 쉽지만 전체 그래프는 분할되지 않습니다. 큰 데이터 세트를 동적으로 분할해야하는만큼 전체 그래프의 이점을 필요로하지 않습니다. 전체 데이터 집합은 단일 서버에 적합하지 않습니다.

  1. 일부 "하위 폴더"
  2. 분할 데이터베이스 제외 "폴더"(로드에있는 모든 노드를 선택 :

    기능은 내가 (이 정상적인 컴퓨터 파일 시스템 인 것처럼 설명)하는 필요)

시스템로드는 대부분 읽기 (약 90 %)입니다.

감사합니다.

+0

데이터 집합이 얼마나 큰? 코드를 필요로하기 전에 조기에 코드를 최적화 할 수 있습니다. 당신이 나눌 수있는 것에 대한 아이디어가 있었습니까? 당신은 나무가 샤딩에 익숙하다고 말하지만, 그래프가 샤딩과 같은 문제를 가진 많은 나무를 볼 수 있기 때문에 당신은 정교 할 수 있습니다. – Nicholas

+0

http://thinkaurelius.com/2013/03/30/titan-server-from-a-single-server-to-a-highly-available-cluster/ Titan을 확인하십시오. 그래프 데이터베이스는 규모에 맞게 만들어졌으며 심지어는 조각으로 만들어졌습니다. – ryan1234

+0

@Nicholas 약 1GB-100TB가 될 것입니다. 그러나 모든 것을 확장 할 수 있기를 바랍니다. 나는 "폴더 레벨"즉, 한 서버에는 "폴더"를 넣고 다른 서버에는 다른 폴더를 넣을 수 있습니다. –

답변

0

내가 도움을주고 싶었고 내 링크가 정말로 가치있는 대답이라고 생각하지 않았기 때문에 나는 의견을 말했습니다. =)

나는 타이탄을 주시하고 있었고 지금은 매우 희미 해 보인다. 기사 (http://thinkaurelius.com/2013/03/30/titan-server-from-a-single-server-to-a-highly-available-cluster/)를 읽은 후에는 카산드라를 일정 용량으로 사용하는 것처럼 보였으므로 카산드라의 규모는 타이탄의 규모와 밀접하게 연관되어 있습니다.

기사에서 명시 적으로 데이터를 분류 할 필요가없는 것으로 보입니다. 특정 크기에 도달하면 자동으로 배포됩니다. 여기

는 타이탄에 대한 또 다른 표현이며 어떻게 카산드라는 사용 http://blog.andreamostosi.name/2013/03/titan-distributed-graph-database/

+0

최첨단 솔루션을 사용하면 어떤 위험이 있습니까? –

+0

내가 당신이라면 나는 타이탄에있는 사람들에게 즉시 연락하여 관계를 형성 할 것입니다. 만약 당신이 그들에게 말을하지 않는다면 어떤 종류의 버그를 치고 어떤 일이 일어나고 있는지에 대해 아무런 지원이나 통찰력을 갖지 못할 위험이 있습니다. 위험은 타이탄에 대해 1 톤의 코드를 작성하고 사용하지 못하게되거나 사용할 수 없게되는 것입니다. Neo4j는 그 역사를 가지고 있지만 타이탄은 그 다음 최고가 될 것입니다. 이것은 경찰관처럼 보일지 모르지만 요즘에는 트위터에 출혈이 가득합니다. @aureliusgraphs를 따라 질문하십시오. 나는 그들이 대답 할 걸! – ryan1234

+0

@aureliusgraphs에서 아직 응답이 없습니다. 카산드라를 기반으로하기 때문에 카산드라와 같은 한계가 있습니까? 그리고 cassandra는 어떤 서버에 어떤 것을 저장해야하는지 알고, 서버를 가로 지르는 그래프 탐색을 최소화하려면 어떻게해야합니까? –

관련 문제