정적 HTML뿐만 아니라 페이지의 동적 콘텐츠를로드하려고합니다. 예를 들어, http://www.balsamiq.com/에서 HTML을로드하는 경우 페이지 맨 아래에 큰 평가 상자가 누락됩니다. 나는 html을 사용하여로드 할 수 있다는 것을 알고있다.Ruby에서 동적 콘텐츠로 HTML 소스 가져 오기
html = open(url).read
다시 말해, 페이지가로드 될 때 표시되는 동적 내용이 누락 될 것이다. 사이트를 볼 때 인간이 얻는 것과 일치하는 완전한 HTML을 어떻게 얻을 수 있습니까? 감사!
자바 스크립트도 실행해야합니다. 나는 Selenium이 여기에서 도울 수 있다고 들었다. –
내가 틀렸다면 정정 해 주겠지 만 자동 작업과 테스트를 수행 할 때 Selenium이 더 낫다고 생각됩니다. 페이지로드가 수행 되기만하면됩니다. html 소스 대신 매우 자주 동적으로로드되는 웹 페이지에 대한 정보를 찾고 있습니다. 브라우저에서 소스를 볼 때 여전히 원하는 정보를 얻지 못합니다. – jrbalsano
다음과 같은 경우 capybara를 사용했습니다. http://stackoverflow.com/questions/7457245/run-capybara-in-rake-task – tokland