2016-07-11 1 views
1

내가하고있는 프로젝트의 위키 피 디아 기사 URL과 동일한 끝까지 이어지는 모든 다른 URL을 알아야합니다.위키 피 디아 페이지로 리디렉션되는 모든 URL 목록 가져 오기?

https://en.wikipedia.org/wiki/Lucite

최종 URL로 리디렉션 : 예를 들어 그러나

https://en.wikipedia.org/wiki/Poly(methyl_methacrylate)

, 내가 다른 URL이 해당 페이지의 최종 URL로 리디렉션 얼마나 많은 모르겠어요, 시간이 다른 모든 Wikipedia 기사에서 발행됩니다. 특정 API 호출이 있습니까? 최종 page_name/URL을 보낼 수 없다는 것을 알 수 있으며 최종 URL로 리디렉션되는 모든 이름/URL의 JSON을 반환합니다. 존재하는 경우 정말 이와 같은 것이 필요합니다. 참고로, 나는 이미 보았다, 나는 당신이이 같은 모든 페이지에 두 개의 API 호출을 수행 할 수 있다는 사실을 알고 있어요 :

https://en.wikipedia.org/w/api.php?action=query&generator=allpages&format=json&gaplimit=500&gapfilterredir=nonredirects

다음 리디렉션의 nonfiltering하는 하나

https://en.wikipedia.org/w/api.php?action=query&generator=allpages&format=json&gaplimit=500&

나는이 두 세트의 연결을 끊을 수 있으며 URL 리디렉션을하고 있으며 모든 페이지에 대해 무한정 수행 할 수 있으며 모든 리디렉션 이름/URL을 찾을 수 있음을 이해하지만 프로젝트 지수에 저장하게됩니다. 내가 단순히 Wikipei에 URL을 보내는 방법을 찾을 수 있다면 dia의 API와 어떻게 든 최종 페이지 URL로 연결되는 모든 URL의 목록을 가져옵니다. 미리 감사드립니다.

+1

참고해야 할 필요가 있다고 생각 URL 정규화로 인해 무한대입니다. 예를 들어'Lucite','Lucite_' 및'Lucite__'는 모두 같은 위치로 리디렉션됩니다. – Tgr

+0

감사합니다. 고맙게도 위키피디아의 리디렉션 직접 매핑은 아래 답변과 같습니다. 특정 페이지를 저장할 수있는 모든 가능한 외부 참조가 있는지 확인하고 싶었 기 때문에 위키 피 디아의 각 기사에서 얼마나 많은 "내부 백 링크"를 잘못 계산하지 않았기 때문입니다. 위키 백과 자체 전체에 걸쳐 있습니다. – EazyC

답변

관련 문제