2013-02-05 2 views
4

사과 앱 스토어에 대한 일부 글로벌 통계를 원합니다. 하나의 병목 현상은 현재 활성화 된 모든 응용 프로그램의 ID (최소 9 자리 숫자)를 얻는 중입니다. 누구든지 iOS 앱 스토어에서 현재 활성화 된 모든 앱의 전체 목록을 가져 오는 방법을 알고 있습니까? 특정 카테고리의 모든 ID (예 : "교육")가 더 좋습니다.모든 ios 앱의 전체 목록보기

몇 가지 방법을 시도했지만 신뢰할 수있는 것은 없습니다.

http://iphoneapplicationlist.com/apps/ipad/에 앱 목록이 있지만 2012 년 11 월에 목록이 중지됩니다. 사과는 https://itunes.apple.com/us/genre/ios-education/id6017?mt=8에 검색 목록을 제공하지만이 목록은 불완전한 것으로 나타납니다. (다른 목록과 비교해 보면 누락 된 8000 개 이상의 앱이 있는데, 특히 내 자신의 앱 :-)).

그래서 내 qeustion은 : 스스로 제공 할 수있는 PHP와 자바 스크립트 프로그래밍은 모든 앱의 모든 앱 ID를 가져 오는 좋은 방법입니다.

답변

0

모두 모바일 앱을 찾을 수는 없지만 최근에 업데이트 된 앱 목록이 iTunes Sitemaps 파일에있는 것으로 보입니다. (I 정확히 애플 리케이션은 맵 파일에 포함되어있는 확실하지 않다 - 나는 그것을 해결하면 나는이 대답을 업데이트합니다.)

이 목록을 얻으려면 :

  1. 크롤링 https://itunes.apple.com/robots.txt. 모양은 다음과 같습니다. itunes.apple.com robots.txt file

  2. 해당 사이트 맵 파일을 크롤링합니다. 더 많은 sitemap 파일을 참조하는 더 많은 sitemap 파일을 참조합니다. 일부 sitemap은 XML 형식이고, 일부는 gzip으로 압축 된 XML 형식이며, 일부는 JSON 형식입니다. 앱에 포함되지 않은 이름으로 itunes_music이 포함 된 사이트 맵을 제외합니다.

    12,500 개의 사이트 맵 관심 있습니다. 초당 4 개의 사이트 맵에서 1 시간 이내에 사이트 맵을 다운로드 할 수 있습니다.

  3. 사이트 맵은 loc 개의 요소와 xhtml:link[href][rel=alternate] 개의 요소를 포함합니다. XML을 구문 분석하고 이러한 값을 가져옵니다.

  4. 각 URL의 로캘/국가 코드와 ID를 구문 분석합니다.

이런 식으로 719,344 ID를 발견했습니다.