2012-07-18 2 views
1

주어진 URL 배열을 스캔하여 웹 페이지, URL 및 상태 코드에 표시하는 스캐너를 빌드해야합니다. 저는 약 50 개 미만의 url에 대해이 작업을 수행했습니다. 문제는 그 이상을 검사 할 때 스크립트가 실행하는 데 더 많은 시간이 걸리고 서버가 504 Gateway Timeout 오류를 반환하는 것입니다.파이썬 wsgi 웹 사이트 스캐너

스캔하는 동안 URL을 인쇄 할 수있는 방법이 있습니까? 모든 URL을 스캔 한 후에가 아닙니다. 파이썬 wsgi를 사용하고 있습니다.

답변

1

필자는 Python yield 키워드를 사용하여 문자열을 개별적으로 반환 할 수 있음을 발견했습니다.이 과정을 완료하기 위해 전체 프로세스가 완료 될 때까지 기다리지 않아도됩니다.

def htmlOut(): 
    yield '<html>' 
    yield '<body><h1>' 
    yield 'Hello world' 
    yield '</h1></body></html> 
관련 문제