2013-02-24 4 views
1

Github에서 무작위로 샘플 repos에 대한 솔루션을 찾고 있습니다. 최종 결과는 샘플에서 일부 데이터 분석을 수행하는 것입니다.무작위로 샘플 Github 리포지토리

내가 뭘하고 싶은지는 저장소의 ID에 따른 샘플입니다. 0에서 270 만 사이의 int를 샘플링하고 관련 repo를 찾습니다. 내가 username/repo-name을 얻은 후에는 API를 사용하여 자세한 정보를 얻습니다.

문제는 repo id로 검색하는 방법을 모른다는 것입니다. 어떤 제안? 나는 webscraping이나 Python 솔루션에 개방적이다.

+0

하지 도움이된다면 나머지 api를 통해 int id로 사용자에게 액세스 할 수 있습니다. 그런 다음 임의의 사용자가 임의의 저장소에 액세스 할 수 있습니다. – three

답변

1

파이썬을 사용하여 GitHUb V3 Api에 액세스 할 수 있습니다 ("Most suitable python library for Github API v3"와 같이).

그리고 당신은 access GitHub repos은, 매개 변수, 마지막 저장소의 정수 ID로와 특정 ID (GET /repositories에서 당신은 본 적이 있습니다. 그래서 자신의 ID로의 repos에 액세스 할 수있는 우회 방법을 제공 할 수

+0

솔루션을 이해하지 못합니다. 더 자세히 알아 보시겠습니까? 특히 " 마지막으로 본 리포지토리는 무엇입니까? –

+0

@ Cam.Davidson.Pilon 그것은 특정 ID를 시작하는 모든 repos를 나열한다는 것을 의미합니다. 귀하의 경우에는 해당 ID에 해당하는 repo에 액세스하는 첫 번째 리포지토리 만 선택할 수 있습니다. id. – VonC

+0

예를 들어, https : //api.gith ub.com/repositories?ID=50000은 50000 이상의 ID를 반환해야합니다.하지만 (적어도 나를 위해)이 URL은 그렇게하지 않습니다. –

관련 문제