2012-06-08 3 views
0

정적 HTML뿐만 아니라 페이지의 동적 콘텐츠를로드하려고합니다. 예를 들어, http://www.balsamiq.com/에서 HTML을로드하는 경우 페이지 맨 아래에 큰 평가 상자가 누락됩니다. 나는 html을 사용하여로드 할 수 있다는 것을 알고있다.Ruby에서 동적 콘텐츠로 HTML 소스 가져 오기

html = open(url).read 

다시 말해, 페이지가로드 될 때 표시되는 동적 내용이 누락 될 것이다. 사이트를 볼 때 인간이 얻는 것과 일치하는 완전한 HTML을 어떻게 얻을 수 있습니까? 감사!

+0

자바 스크립트도 실행해야합니다. 나는 Selenium이 여기에서 도울 수 있다고 들었다. –

+0

내가 틀렸다면 정정 해 주겠지 만 자동 작업과 테스트를 수행 할 때 Selenium이 더 낫다고 생각됩니다. 페이지로드가 수행 되기만하면됩니다. html 소스 대신 매우 자주 동적으로로드되는 웹 페이지에 대한 정보를 찾고 있습니다. 브라우저에서 소스를 볼 때 여전히 원하는 정보를 얻지 못합니다. – jrbalsano

+0

다음과 같은 경우 capybara를 사용했습니다. http://stackoverflow.com/questions/7457245/run-capybara-in-rake-task – tokland

답변

1

ruby ​​gem Mechanize을 사용하고 user_agent를 설정하여 문제를 해결했습니다. 반드시 내 질문에 대한 대답은 아니지만 user bot을 user_agent로 설정하고 javascript가있는 페이지는 덜 동적 인 형식으로 표시됩니다.

0

watir이 (가) 여기에 도움이 될 수도 있습니다.

관련 문제