나는이 게시물 검색 한 형태로 규정 및 검색 결과를 그 다음 스크립트 :출력
import mechanize
url = "http://www.taliesin-arlein.net/names/search.php"
br = mechanize.Browser()
br.set_handle_robots(False) # ignore robots
br.open(url)
br.select_form(name="form")
br["search_surname"] = "*"
res = br.submit()
content = res.read()
with open("surnames.txt", "w") as f:
f.write(content)
그러나 렌더링 된 웹 페이지, 여기에 따라서 스크립트로 검색을 제한 250 결과. 이 제한을 무시하고 모든 결과를 검색 할 수있는 방법이 있습니까?
고맙습니다.
귀하의 질문을 이해할 수 있을지 확실하지 않습니다. 웹 요청이 단지 250 개의 결과를 반환합니까? –
당신은 2 가지 가능성이 있습니다 : 1 www.taliesin-arlein.net의 웹 마스터에게 편지를 쓰고 모든 결과를 묻습니다; 2 사이트를 해킹하고 모든 성을 훔칩니다 .... 진지하게 : 그것은 스크립트의 답변을 최대 크기를 변경하는 모든 인수를 dosn't 나에게 솔기. –
권자는 아무것도 훔치고 싶지 않습니다. 웹 사이트에서 허용하는대로 반복 된 쿼리를 수행하여 모든 데이터를 가져올 수 있기 때문에 가정 했었습니다. 그런 다음 한 번에 모든 작업을 수행 할 수있는 방법이있을 것입니다. 예, 웹 요청은 처음 250 개의 결과 만 반환합니다. – brucezepplin