2013-03-26 2 views
1

나는 다음과 같은 wget을 명령 있습니다wget과 조건 링크

이 모든 것을 수행
wget --http-user='user' --http-password='password' --trust-server-names --quiet -r -p -k -E -e robots=off -P /Users/Sebastian/Desktop/test/ http://somedomain.com 

나는 그것이 다음을 제외하고 싶어합니다. 이것에

<link rel="canonical" href="http://somedomain.com/somedir/somedir/somedir/folder/" /> 

: 그것은이에서 내 정식 링크를 다시 작성

<link rel="canonical" href="index.html" /> 

내가 다시 쓰기 과정 중 정규 링크를 남길 수있는 방법을 어떤 생각?

+0

나는 wget에서 -k 옵션을 제외하고 결국 링크를 전혀 터치하지 않습니다. 파일을 얻은 후에 나는 원하는대로 모든 것을 다시 작성하기 위해'find'와'sed'로 반복합니다. 너무 우아한 것은 아니지만 작동합니다. – Sebastian

답변

0

URL이 주어진 URL로부터 캐노피로 태그가 지정되었는지 감지 할 수 있습니까? 한 가지 해결책은 해당 페이지를 다운로드하지 않기 때문입니다.

또 다른 해결책은 모든 것을 다운로드하는 것입니다. 해당 칸 마크 표시된 파일을 제거하고 설명한대로 다시 쓰기보다 here.

+0

불행히도 나는 그것을 발견 할 수 없다 ... – Sebastian

관련 문제