2013-03-16 3 views
1

저는 RDf를 처음 사용하고 있으며 우수한 읽기 성능을 가진 오픈 소스 RDF 데이터베이스를 찾고 있습니다. 초당 약 100 억 개의 트리플과 100 개 이상의 SPARQL 쿼리가 있습니다. 지금 당장 데이터베이스를 읽고 쓰지 않아도됩니다.어떤 SPARQL 구현 (triplestore)이 읽기 성능에 이상적입니까?

나는 위키 피 디아 (http://en.wikipedia.org/wiki/SPARQL#SPARQL_implementations)에서 데이터베이스를 사용하는 것을 보았지만 가장 많은 시간을 테스트 한 시스템에 대한 전문가의 조언을 원합니다. Apache 라이센스 또는 동등한 라이센스가 있어야합니다.

답변

4

아마도 Jena와 Sesame은 라이센스 기준에 맞는 유일한 데이터베이스 일 뿐이지 만 필요한 크기로 확장되지는 않습니다. Jena가 TDB 일 수도 있고 일 수도 있습니다.하지만 성능은 그 규모에서 어떻게 될지 잘 모르겠습니다. 참깨 원주민은 확실히 그 규모에 맞게 설계되지 않았습니다.

다른 오픈 소스 데이터베이스가 있지만 성능 기준에 맞는 4store와 같은 GPLed입니다. 하지만 가장 좋은 방법은 상업용 데이터베이스를 사용하는 것입니다 (대부분 무료 평가판을 사용합니다). 원하는 크기와 읽기 처리량을 얻는 가장 좋은 방법입니다. 그러나 그것은 당신이 실제로 열심히 일하는 사람에게 돈을 지불해야한다는 것을 의미합니다.

+3

"실제로 열심히 일하면서 돈을 지불해야 할 수도 있습니다."+1 – RobV

관련 문제