2012-11-12 5 views
2

현재 Virtuoso를 사용하여 RDF 트리플을 저장하고 있습니다. RDF 파일을 데이터베이스에로드하는 자동화 된 방법이 필요합니다. 데이터가 매우 클 수 있으므로 현재 Virtuoso bulk data loader을 사용하여 데이터를로드하고 있습니다. 그러나 앞으로는 다른 트리플 스토어로 전환 할 가능성이 있으므로이 같은 플랫폼 별 솔루션에 의존하기를 원하지는 않습니다. 대규모 RDF 파일을 트리플 스토어에로드하는 좀 더 일반적인 크로스 플랫폼 방식이 있습니까?트리플 저장소에 큰 RDF를로드하기위한 플랫폼 간 방법

대부분의 프로그래밍은 파이썬으로 이루어 지므로 파이썬 바인딩을 사용하는 솔루션이 바람직합니다.

저는 시맨틱 웹 기술에 새로운 것이므로 제 질문이 충분히 상세하지 않은지 알려 주시면 자세한 정보를 제공해 드리겠습니다. 고맙습니다!

답변

1

은 거장 RDF의 수는 부분적으로 WebDAV를 같은 & ODS 또는 다른 매장에서 다르게 구현 기능 또는 전혀를 거장에 고유 한 것을 특징으로 거장에 고유 한 대부분의 http://virtuoso.openlinksw.com/dataspace/dav/wiki/Main/VirtRDFInsert에서 자세한 방법을 삽입 할 수 있습니다.

아마도 가장 일반적인 방법은 데이터 세트를 파이썬으로 읽고 SPARQL 1.1 업데이트 (http://www.w3.org/TR/sparql11-update/) 명령을 사용하여 데이터를 Virtuoso 또는 SPARQL 1.1 업데이트를 지원하는 다른 트리플 스토어에 삽입 /로드하는 것입니다. 대부분 지금 할 것입니다. 이 접근법의 가장 큰 단점은 삽입 프로세스가 데이터가 일관성있게로드되고 교착 상태, 롤백 등을 처리 할 수 ​​있도록 Python에서 관리해야한다는 것입니다.이 메서드는 매우 큰 데이터 집합의 경우 훨씬 느리고 너무나도 용납 할 수 없게 만듭니다. 대부분의 공급 업체가 데이터 일관성 및 교착 상태 등을 내부적으로 훨씬 빠르게 처리하는 자체 "대량 로더"방법을 제공하는 이유입니다.

관련 문제