2011-12-07 4 views
-3

위키 피 디아 페이지 (infobox가 포함 된 것)에서 모든 infobox 속성과 값을 얻으려고합니다. 간단한 WebRequest를 사용하여 infobox를 구문 분석하면 너무 많은 쓰레기가 발생합니다. 따라서 dbpedia을 사용하고 Jena (SPARQL)를 사용하여 데이터를 가져 오는 것이 좋습니다. 어떻게하면됩니까? 모든 속성을 키 값 쌍으로 제공하는 간단한 쿼리가 있습니까? 또는 RDF로 변환 한 다음 필요에 맞게 변환하십시오.위키 피 디아에서 모든 속성 가져 오기 infobox (java)

답변

0

http://dbpedia.org/sparql에 dbpedia에 대한 공용 SPARQL 엔드 포인트가있어서 실험에 사용할 수 있습니다. http://wiki.dbpedia.org/OnlineAccess에 설명되어있는 쿼리 작성을위한 예제 및 다양한 도구가 있습니다. 데이터 세트를 다운로드하여 로컬에서 쿼리를 시도 할 수도 있습니다.

명확히하기 위해 RDF는 dbpedia가 게시되는 데이터 형식입니다. SPARQL은 RDF를 쿼리하기위한 쿼리 언어입니다. Jena는 RDF 데이터 스토어와 SPARQL 엔진을 포함하는 특정 구현물이다.

+0

downvoter가주의를 기울이시겠습니까? 문제를 발견 한 경우 해답을 개선하는 것이 좋습니다. – DNA

관련 문제