2013-04-05 2 views
0

수확 된 원자 피드 세트가 있습니다. 그들 중 일부는 몇 년의 시간이 걸리고 일부는 더 이상 존재하지 않는 이미지로 연결됩니다.archive.org에 보관 된 파일의 최신 버전 얻기

Way Back Machine에 의해 보관 된 최신 버전을 얻는 방법이 있습니까?

수동으로 처리 할 수 ​​있음을 알고 있지만 프로세스를 자동화하고 싶습니다. archive.org는 편안한 API를 제공하지만, 내가 알 수있는 한, 필요한 특정 호출을 제공하지 않는 것 같습니다. 나는 언제나 웹 폐기 (web-scrapping)로 대체 할 수 있다고 생각하지만, 좀더 우아한 해결책을 원한다.

답변

0

알아 냈어. 방금 GET URL에있는 파일의 최신 버전을 얻으려면 (HTTP 상태 코드는 200 있는지 확인하는 것을 잊지 마세요) :

http://web.archive.org/web/form-submit.jsp?type=replay&url=<file_url>