2010-01-24 5 views
0

암호로 보호 된 웹 페이지와 하위 링크를 몇 개 갖고 싶습니다. 사용자 이름과 암호가 있으며 일반 브라우저 UI에서 액세스 할 수 있습니다.비밀번호로 보호 된 웹 위키 페이지를 어떻게 추출합니까?

wget --http-user=USER --http-password=PASS http://mywiki.mydomain.com/myproject 

을하지만 다시 암호를 묻습니다으로 위, 작동하지 않는 :하지만 나중에 참조 할 수 있도록 내 로컬 드라이브에이 페이지를 저장하려면, 나는 그들을 얻을 WGET을 사용하고 있습니다. 암호를 다시 묻는 시스템에 걸리지 않고도이 작업을 수행 할 수있는 더 좋은 방법이 있습니까? 또한 특정 페이지의 모든 링크와 하위 링크를 가져 와서 단일 폴더에 저장하는 것이 가장 좋은 방법은 무엇입니까?

업데이트 : 액세스하려는 실제 페이지가 HTTPS 게이트웨이 뒤에 있으며 동일한 인증서가 유효하지 않습니다. 이 문제를 해결할 방법이 있습니까?

mysystem-dsktp ~ $ wget --http-user=USER --http-password=PASS https://secure.site.mydomain.com/login?url=http://mywiki.mydomain.com%2fsite%2fmyproject%2f 
--2010-01-24 18:09:21-- https://secure.site.mydomain.com/login?url=http://mywiki.mydomain.com%2fsite%2fmyproject%2f 
Resolving secure.site.mydomain.com... 124.123.23.12, 124.123.23.267, 124.123.102.191, ... 
Connecting to secure.site.mydomain.com|124.123.23.12|:443... connected. 
ERROR: cannot verify secure.site.mydomain.com's certificate, issued by `/C=US/O=Equifax/OU=Equifax Secure Certificate Authority': 
    Unable to locally verify the issuer's authority. 
To connect to secure.site.mydomain.com insecurely, use `--no-check-certificate'. 
Unable to establish SSL connection. 

--no-check-certificate 옵션도 시도했지만 작동하지 않습니다. 이 옵션으로 로그인 페이지 만 얻었고 요청한 실제 페이지가 아닙니다.

+0

첫 번째 질문은 다음과 같습니다. –

+0

예, 허용되었습니다. – gagneet

답변

1

시도해 볼까요?

wget http://USER:[email protected]/myproject 
+0

감사합니다. 시도했지만, 작동하지 않습니다. 그냥 로그인 페이지의 사본을 가져옵니다 ... :-( – gagneet

0

양식으로 보안 설정된 페이지에 액세스하려고합니다.

해당 --no-check-certificate 옵션을 사용하고이 포럼 스레드 제안을 따르십시오 : Can't log in with wget.

+0

내가 액세스하려고하는 페이지는 https 연결 뒤에 있으며 SSL 인증서가 필요합니다. 링크에 설명 된 것과 다릅니다 ... 다른 몇 가지가 있습니다. 메서드를 ssl 인증서와 함께 사용할 수 있습니다. – gagneet

관련 문제