Wikipedia 카테고리/페이지 사이에 거리의 [방향성?] 개념/구현이 있습니까?위키 거리 : 위키 주제와 카테고리 사이의 거리?
예를 들어 고려 : A) "세인트 루이스 대학"B) "대학"
은 분명히 "A"는 "B"의 일종입니다. Wiki에서 이것을 어떻게 추출 할 수 있습니까? 모든 범주가 연결 추출 할 경우 , 당신은
Category:1818 establishments in Missouri Territory
Category:Articles containing Latin-language text
Category:Association of Catholic Colleges and Universities
Category:Commons category with local link same as on Wikidata
Category:Coordinates on Wikidata
Category:Educational institutions established in 1818
Category:Instances of Infobox university using image size
Category:Jesuit universities and colleges in the United States
Category:Roman Catholic Archdiocese of St. Louis
Category:Roman Catholic universities and colleges in Missouri
을주는 것을 볼 수있을 그것은 바로 B (https://en.wikipedia.org/wiki/University)에 연결 할 수있는 모든 작업이 포함되어 있지 않습니다. 그러나 본질적으로 더 자세히 살펴보면 A와 B 사이의 다중 홉 경로, 가능한 여러 홉을 찾을 수 있어야합니다. 이것을 달성하는 대중적인 방법은 무엇입니까?
-은 https ://github.com/wasiahmad/Mining-Wikipedia/tree/master/WikiNomy –
@WasiAhmad 프로젝트가 MediaWiki API를 통해 Wiki 정보에 액세스하는 것과 어떻게 다릅니 까? – Daniel
내 프로젝트는 API를 사용하지 않고 Wiki 덤프에서 직접 카테고리 계층 구조를 추출합니다. 내 연구 활동 중 하나에 대해 전체 위키 카테고리 계층 구조가 필요했기 때문에 해당 프로젝트를 개발했습니다. –