위키 피 디아 페이지 (infobox가 포함 된 것)에서 모든 infobox 속성과 값을 얻으려고합니다. 간단한 WebRequest를 사용하여 infobox를 구문 분석하면 너무 많은 쓰레기가 발생합니다. 따라서 dbpedia을 사용하고 Jena (SPARQL)를 사용하여 데이터를 가져 오는 것이 좋습니다. 어떻게하면됩니까? 모든 속성을 키 값 쌍으로 제공하는 간단한 쿼리가 있습니까? 또는 RDF로 변환 한 다음 필요에 맞게 변환하십시오.위키 피 디아에서 모든 속성 가져 오기 infobox (java)
-3
A
답변
0
http://dbpedia.org/sparql에 dbpedia에 대한 공용 SPARQL 엔드 포인트가있어서 실험에 사용할 수 있습니다. http://wiki.dbpedia.org/OnlineAccess에 설명되어있는 쿼리 작성을위한 예제 및 다양한 도구가 있습니다. 데이터 세트를 다운로드하여 로컬에서 쿼리를 시도 할 수도 있습니다.
명확히하기 위해 RDF는 dbpedia가 게시되는 데이터 형식입니다. SPARQL은 RDF를 쿼리하기위한 쿼리 언어입니다. Jena는 RDF 데이터 스토어와 SPARQL 엔진을 포함하는 특정 구현물이다.
0
http://wiki.dbpedia.org/Downloads37에서 덤프를 사용해보십시오. 예 : "원시 Infobox 속성".
관련 문제
- 1. PHP 가속기 위키 피 디아에서
- 2. JQuery로 위키 피 디아 infobox 콘텐츠 가져 오기
- 3. 위키 피 디아에서 HTML을 파싱하는 모범 사례?
- 4. 아이폰에서 위키 피 디아에서 데이터를 읽는 방법?
- 5. 위키 피 디아에서 통계 정보를 추출합니다.
- 6. 위키 피 디아에서 30000 개의 문서를로드 중입니다.
- 7. 위키 피 디아에서 데이터를 추출하는 Python 라이브러리?
- 8. 음악 카테고리 및 취급 업데이트로 위키 피 디아에서 이미지 다운로드
- 9. MQL에서 위키 피 디아 ID 가져 오기
- 10. 위키 피 디아에서 텍스트 및 수정본 diffs에 사용하는 것
- 11. 위키 피 디아에서 MySQL과 Perl로 무작위로 페이지를 만들 수 있습니까?
- 12. SOAP과 다른 다른 프로토콜을위한 WSDL? 위키 피 디아에서
- 13. 위키 백과 API를 사용하여 위키 피 디아 페이지의 infobox 내 첫 번째 이미지를 추출하는 선택기
- 14. 파싱 위키 피 디아 범주
- 15. 리디렉션 위키 피 디아 요청
- 16. 위키 피 디아 광부에 관해서
- 17. 위키 백과의 콘텐츠 가져 오기
- 18. 위키 백과 PHP로 Infoboxes 가져 오기
- 19. 위키 피 디아 API : 오늘 URL의 그림
- 20. 위키 피 디아 데이터에 액세스 할 수있는 Java API가 있습니까
- 21. 위키 피 디아 페이지의 하위 카테고리
- 22. 위키 백과의 xml.bz2 옵션 가져 오기
- 23. 위키 피 디아 API - JSON 객체에 액세스하기
- 24. Java/Swing에서 시스템 글꼴 속성 가져 오기
- 25. umbraco의 탭에있는 모든 속성 가져 오기
- 26. 값 반영을 포함한 모든 속성 가져 오기
- 27. EpiServer CMS - 변경된 모든 속성 가져 오기
- 28. 하위 요소의 모든 속성 가져 오기
- 29. 특정 속성으로 표시된 모든 속성 가져 오기
- 30. 위키 피 디아를 긁어서 파싱하기 페이지
downvoter가주의를 기울이시겠습니까? 문제를 발견 한 경우 해답을 개선하는 것이 좋습니다. – DNA