2012-10-12 2 views
0

나는 "숨겨진"html 코드에 당황 스럽다. 나는 "소스보기"기능을 사용하는 경우, 내가 추출하기 위해 노력하고 HTML 소스의 섹션은 다음과 같습니다 : 나는 파이어 폭스에서 "요소 검사"기능을 사용하는 경우숨겨진 html을 파이썬으로 추출하기

<div class="comments_with_more"> 
    <div id="comments_section"> 
    </div> 
</div> 

, 그것은 추가 레이어를 보여줍니다 '소스보기'옵션에서 숨겨져 있습니다.

<div class="comments_with_more"> 
    <div id="comments_section"> 
    <div id="comments"> 
     (....what I am trying to get to.........) 
    </div> 
    <script> 
    </div> 
</div> 

나는이 스크립트가 엉망이 될 수도 있다고 생각합니다. 누구든지 숨겨진 코드를 일반 또는 파이썬으로 가져 오는 방법을 알고 있습니까?

+10

(이미로드 자바 스크립트 변경 페이지를 구문 분석) 무엇을해야 할 행동에 그것을 볼 수 있습니다 그들은 JavaScript에 의해 추가되었습니다. "소스보기"는 서버에서 보낸 HTML 구조를 보여주고, "Inspect Element"는 자바 스크립트 코드에 의해 변경된 것을 포함하여 * 현재 * HTML 구조를 * 현재 보여줍니다 *. –

답변

1

이 바인딩 webkit 년대를 사용해야 here 당신은 당신이 여분의 부분은 숨겨지지 않습니다

+0

감사합니다. 해당 웹 페이지에서 코드를 실행했지만 빈 페이지를 반환하는 것 같습니다. html 변수의 내용은 PyQt4.QtCore.QString (u '')입니다. 내가 놓친 게 있니? 감사. – ezbentley