저는 파이썬을 처음 사용하고 자문을 구합니다. php/java/ajax에 의해 생성 된 포럼 페이지의 내용을 가져와야합니다. 소스 코드에는 php/java/ajax에 의해 페이지에 추가 된 모든 요소가 포함되어 있습니다. 페이지의 완전한 소스 코드를 읽을 수 있습니까? urlopen()은 원시 소스 코드만을 제공합니다.파이썬을 사용하여 포럼 페이지의 내용을 얻는 방법
답변
qt4 라이브러리 세트에는 웹킷 엔진이 포함되어 있습니다. 즉, 먼저 페이지를 렌더링 한 다음 생성 된 HTML을 구문 분석 할 수 있습니다. 내가 말할 수있는 한, Google Project Hosting에 프로젝트가 있습니다.
그리고 Qt4만으로이 작업을 수행 한 또 다른 샘플은 link입니다. 의견을 확인하기 위해 모든 Ajax 콘텐츠가로드되었는지 확인하는 방법에 대해 설명합니다.
나는 그 해결책을 좋아한다. 우리 야간 검사에도 좋습니다. 물론 qt는 간단한 솔루션이 아닙니다 ... 중요한 AJAX 호출을 수행하는 것이 더 빠를 것이라고 생각합니다. 그러나 그가 HTML 전체를 필요로한다면 이것은 정말 좋은 해결책입니다. – Andreas
가볍지 않다는 것을 알고 있습니다. 그러나 그것을 지적하는 것이 좋습니다. :-) –
Selenium은 작업에 적합합니다. 브라우저 자동화를위한 여러 언어 (원인 including Python)의 유용한 라이브러리입니다.
댓글과 유용한 링크를 위해 모두에게 많은 감사를드립니다 !!! 지금 공부할 정보가 많습니다. !!!! – user1826398
어떻게 든 고스트 라이브러리가 가장 적합하다고 봅니다. 고스트는 https://github.com/jeanphix/Ghost.py
- 1. PHP를 사용하여 asp.net에서 디자인 된 웹 페이지의 내용을 얻는 방법?
- 2. zipcode - 파이썬을 사용하여 시간대 데이터를 얻는 방법?
- 3. $ _GET의 내용을 얻는 방법
- 4. 파이썬에서 맨 페이지의 내용을 얻는 방법은 무엇입니까?
- 5. JQuery Ajax를 사용하여 FCKEditor의 내용을 얻는 방법
- 6. regex를 사용하여 웹 페이지의 정보를 얻는 방법?
- 7. asp.net을 사용하여 웹 페이지의 헤더를 얻는 방법
- 8. textarea의 내용을 얻는 방법
- 9. 웹 페이지의 내용을 확대하는 방법?
- 10. 동적으로 확장되는 페이지의 html 콘텐츠를 얻는 방법
- 11. 클립 보드에서 형식으로 내용을 얻는 방법
- 12. (포럼)
- 13. XElement 내에서 내용을 얻는 방법
- 14. 파이썬을 사용하여 트위터 뉴스 피드를 얻는 것
- 15. 파이썬을 사용하여 네트워크상의 컴퓨터에서 로컬 관리자를 얻는 방법?
- 16. 소켓 - 파이썬을 사용하여 에스테 리스크 서버의 상태를 얻는 방법
- 17. 파이썬을 통해 'java -version'출력을 얻는 방법
- 18. 다른 파일의 내용을 사용하여 파이썬을 사용하여 대용량 파일 필터링
- 19. PUT 요청의 내용을 얻는 방법?
- 20. html 태그 내용을 얻는 방법
- 21. Https URL 내용을 얻는 방법
- 22. WebBrowser 컨트롤에서 내용을 얻는 방법
- 23. 페이지의 머리글 색인을 얻는 방법
- 24. 현재 페이지의 ID를 얻는 방법
- 25. html 페이지의 헤더를 얻는 방법
- 26. jQuery 전체 페이지의 내용을 선택하는 방법
- 27. 파이썬을 사용하여 wifi를 사용하는 방법?
- 28. 파이썬을 사용하여 그래프를 그리는 방법
- 29. easyXDM을 사용하여 제공 업체 페이지의 내용을 수정하십시오.
- 30. Android - 웹 페이지의 내용을 읽는 방법
에 있습니다. 나는 그가 밑줄 친 PHP 코드가 아닌 JS/AJAX 이후에 사이트의 HTML 코드를 의미한다고 생각합니다. – Andreas
예, 맞습니다. 일부 JS/AJAX 뒤에 HTML 코드가 있습니다. – user1826398
당신 말이 맞아요. 내 의견을 삭제했습니다. 그들은 유효하지 않습니다 ... –