자바 스크립트를 많이 사용하는 HTML 문서를 어떻게 파싱하나요? 정적 XML/html 파일을 구문 분석 할 수있는 파이썬에서 몇 가지 라이브러리를 알고 기본적으로 html + 자바 스크립트를 읽는 프로그램이나 라이브러리 (또는 심지어 파이어 폭스 플러그인)를 찾고, javascript 비트를 실행하고 javascript없이 html 코드를 출력합니다. 브라우저에 표시되면 동일하게 보입니다. 간단한 예자바 스크립트 코드를 포함하는 HTML을 구문 분석하는 방법
<a href="javascript:web_link(34, true);">link</a>
로서
자바 스크립트 함수 복귀, 예를 들어 적절한 값으로 대체되어야<a href="http://www.example.com">link</a>
더 복잡한 예는 많은 자바 스크립트 코드로 흩어져있는 저장된 페이스 북 HTML 페이지입니다.
아마도 How to "execute" HTML+Javascript page with Node.js 과 관련이 있습니다.하지만 실제로 Node.js와 JSDOM이 필요합니까? 또한 약간 관련이 Python library for rendering HTML and javascript 하지만 난 순수한 HTML 출력 렌더링에 관심이 아니에요. Mozilla Gecko FAQ에서
어느 자바 스크립트 런타임을 얻고 그것으로 뭔가를 정렬 또는 코드를 분석하여 최종 결과 (강력한 사이트 별 구성)를 찾아 낼 수 있습니다. –
http://stackoverflow.com/questions/19465510/how-to-parse-a-webpage-that-includes-javascript?rq=1 – gliptak