2014-02-20 6 views
0

내 제목은 스크립트를 사용하여 html 페이지를 보여주고 다운로드하려고 함을 나타낼 수 있습니다. 다른 python (및 ActionScript 3) 메서드를 사용해 보았지만 그 중 아무 것도 실제로 웹 사이트에 보이는 모든 내용을 보여주지는 못합니다. 그들은 모두 일부 javascipt 코드전체 html 페이지를 다운로드 할 수 없습니다

나는 아마도 눈에 보이는 내용을 잡을 수있는 몇 가지 방법이 있나요 (I 동적으로 자바 스크립트에 의해 생성 된 다운로드하려는 웹 페이지)를 보여 그러나

? 내가 원하는 기능은 "Select All - Copy"- windows 메소드와 유사합니다.

+3

[JavaScript 지원 기능이있는 브라우저 에뮬레이터] (http://stackoverflow.com/q/21777306/190597)를 사용해야합니다. – unutbu

+0

기계화? http://wwwsearch.sourceforge.net/mechanize/ – markcial

+0

파이썬에서이 패키지 설치 기능에 문제가 있습니다. 나는 pip를 성공적으로 설치했다고 생각하지만, pip로 lxml을 설치할 때 "C : \ Python33 \ lib \ distutils \ dist.py : 258 : UserWarning : 알 수없는 배포 옵션 : 'extra-require' ". 유사한 오류가 많은데 ... – user3257755

답변

0

당신이

내가 원하는 기능이 유사하다 썼다 때문에 "모두 선택 - 복사"- 창 방법.

웹 페이지의 "소스 코드"를 다운로드하고 싶습니다. 이것이 당신이 원하는 것이라면 여기 당신이해야 할 일이 있습니다.

import urllib.request 
import re 

urls = ["http://google.com","http://yahoo.com"]; 

i=0; 
while i < len(urls):  
    htmlfile = urllib.request.urlopen(urls[i]); 
    htmltext = htmlfile.read(); 
    print(htmltext); 
    print("\n"); 
    i=i+1; 

URL을 읽고 소스 코드를 인쇄합니다.

관련 문제