2017-11-23 3 views
-1

웹에서 일부 사진을 크롤링하기위한 토이 프로그램을 작성하고 있습니다.하지만 URL은 js로 생성됩니다. 사람이 어떻게 처리하는 말해 줄 수 .. 구문 분석 된 URL : 웹 크롤러가 동적 생성 URL을 가져올 수 없습니다.

원래의 웹 페이지 : 어쨌든 http://jandan.net/ooxx/page-323#comments

, URI SRC 이미지가 인코딩 및 암호화

+0

구문 분석 된 URL :

+0

방법 @colt에 대한 – Joiningss

+0

兄弟 @colt 是 啥, 能 不能 说 清楚 点 啊 @ Joiningss –

답변

0

덕분에, 당신이 필요로하는 b64, md5 및 사이트 자체의 방법으로 'img-hash'를 해독합니다.

'jandon_load_img'함수를 따르고 반환 값 'c'를 캡처하십시오.

자바 스크립트를 실행 한 후 WebDriver에서 selenium을 (를) 배워 HTML 페이지를 추출 할 수도 있습니다. 이 같은

+0

는 사실, 셀레늄이 처리하는 방법을 알아?.. 하지만 브라우저 없이도이 문제를 해결하고 싶습니다. –

관련 문제