크롤러 4j를 사용하여 Tripadvisor의 크롤러를 작성하고 있습니다. 항목에 대한 모든 리뷰를 수집해야하지만 "다음"리뷰 (숫자가있는 리뷰)에 대한 링크는 링크가 아니라 자바 스크립트 기능과 연결되어 있습니다. 이 기능은 Tripadvisor의 서버에서 정의됩니다. 이 함수를 평가하고 리턴하는 페이지를 얻을 수있는 방법이 있습니까?크롤러 4j 및 Tripadvisor
0
A
답변
0
0
HTMLUnit을 사용하여 페이지 콘텐츠를 가져올 수 있습니다. 이 라이브러리는 모든 자바 스크립트 코드를 실행 한 다음 페이지 코드를 조작하는 데 사용할 수 있습니다.
다음은 예제 code이며 stackoverflow에 대한 질문에서 가져온 것입니다.
HtmlElement element4 = null;
Iterable<HtmlElement> iterable5 = page.getAllHtmlChildElements();
Iterator<HtmlElement> i6 = iterable5.iterator();
while(i6.hasNext() {
HtmlElement anElement = i6.next();
if(anElement instanceof HtmlImage) {
HtmlImage input = (HtmlImage) anElement;
String[] elements = "http://example.com/pages/powerbutton.png".split("/");
if(input.getSrcAttribute().indexOf(elements[elements.length-1])> -1){
element4 = input;
break;
}
}
}
HtmlPage page = element4.click();
관련 문제
- 1. Twitter 4j with Netbeans
- 2. 로그 4j 입력을 참조하십시오
- 3. 동적 콘텐츠 및 크롤러
- 4. 검색 엔진 크롤러 및 SQL
- 5. 연령 확인 양식 및 크롤러
- 6. 파이썬 크롤러
- 7. android twitter 4j 2.2.1 미디어 엔터티를 얻으십시오
- 8. 아이템 가져 오기 4J Java Array
- 9. JS, PHP 동적 콘텐츠 및 Google 크롤러
- 10. 웹 크롤러 및 GET 대 POST 요청
- 11. 사용자 에이전트에서 크롤러 식별
- 12. 루비에서 파이썬으로 이동 : 크롤러
- 13. 자바 CSS 크롤러
- 14. 웹 크롤러 구축
- 15. 자동 웹 크롤러
- 16. 적대적인 웹 크롤러 식별
- 17. 다른 웹 크롤러 Nutch
- 18. 웹 크롤러 클래스
- 19. 웹 크롤러 스크립트 나 웹 크롤러 스크립트 코드를 작성했습니다
- 20. PHP 기반 웹 크롤러 또는 자바 기반 웹 크롤러
- 21. 오픈 소스 C++ 크롤러?
- 22. 링크 검사기 (스파이더 크롤러)
- 23. Google 크롤러 시간 제한
- 24. 파이썬 다중 쓰레드 크롤러
- 25. 경쟁력있는 가격을위한 웹 크롤러
- 26. 크롤러 스크립트 php
- 27. 파일 크롤러 OSError
- 28. 재귀 웹 크롤러 perl
- 29. 자동 웹 크롤러 구축
- 30. RSS 크롤러 피드 리더