2009-10-07 7 views
0

내가 urllib2에서받는 HTML은 Firefox에서 URL 원본을 볼 때 볼 수있는 수십 개의 데이터 필드가 누락되었습니다. 모든 조언을 많이 주시면 감사하겠습니다. 여기에 보이는 것입니다 같은 : urllib2를 반환 HTML에서왜 Firefox 소스에서 볼 수있는 urllib2 테이블 필드가 누락 되었습니까?

# ...<td class=td6>as</td></tr></thead>|ManyFields|<br></div><div id="c1">... 

: 파이어 폭스의 소스보기에서

# ...<td class=td6>as</td></tr></thead>|</table>|<br></div><div id="c1">... 
+0

정말 충분한 정보를 제공하지 못했습니다. 검색하는 URL은 무엇입니까, CGI 스크립트 또는 JSP 또는 정적 HTML입니까? 서버가 사용자 에이전트 처리 (사용자 에이전트에 따라 다른 HTML 반환)를 수행합니까? HTML 스 니펫이 불완전합니다. 더 많은 세부 사항을 편집하고 추가하십시오. –

+0

샘플 URL을 삽입하는 것이 가장 효과적이라고 생각했습니다. - 감사합니다. – KenBurnsFan1

답변

2

그것은 당신이지고있는 페이지가을 가지고 피상적 인 검사에서 보인다 lot of Javascript; 아마도 자바 스크립트는 파이어 폭스에서 마지막으로 볼 수있는 정보를 만드는 데 협조한다. (적어도 일부는 적극적으로 페이지 내용을 변경하고있다.) JS 풍부한 페이지를 다듬어야 할 경우 가장 좋은 방법은 Selenium을 통해 실제 브라우저를 자동화하는 것입니다.

0

표시되는 추가 콘텐츠는 자바 스크립트에 의해 생성됩니다. 원시 HTML 문서의 일부가 아니므로 urllib2와 같은 일반 HTTP 가져 오기 프로그램과 함께 제공되지 않습니다.

관련 문제