2011-04-08 2 views
0

일부 웹 사이트 콘텐츠를 크롤링/아카이브하기 위해 heritrix 3.1.1- 스냅 샷을 사용하고 있습니다. 크롤링되지 않는 URL을 포함하여 처리하는 모든 페이지에서 발생하는 모든 URL을 기록해야합니다.필터링되거나 크롤링되지 않는 URL을 포함하여 모든 발생 URL을 기록하도록 heritrix를 구성하는 방법은 무엇입니까?

내가 오랫동안 찾고있다 그리고 긍정적 인 결과 :(희망 몇 가지를 얻을 수 있습니다받은 havent 한 여기에 도움이됩니다. 감사합니다.

답변

관련 문제