3

아름다운 수프와 selectorgadget을 사용하여 웹 사이트를 긁을 수있는 방법은 무엇입니까? 예를 들어, 웹 사이트가 (a newegg product)이고 인텔 스크립트, 데스크톱, 2.4GHz, 1066Mhz 등의 제품 사양을 모두 반환하는 스크립트가 필요합니다 (사양을 클릭하십시오). ....., 3 년 제한. selectorgadget 사용 후selectorgadget.com을 사용하여 HTML 파일 구문 분석

나는

가 어떻게이 사용합니까 현악기 .desc를 얻을?

감사합니다 :)

답변

1

페이지를 검사, 나는 사양이 ID의 pcraSpecs와 사업부에 배치되는 것을 볼 수 있습니다

<div id="pcraSpecs"> 
    <script type="text/javascript">...</script> 
    <TABLE cellpadding="0" cellspacing="0" class="specification"> 
    <TR> 
     <TD colspan="2" class="title">Model</TD> 
    </TR> 
    <TR> 
     <TD class="name">Brand</TD> 
     <TD class="desc"><script type="text/javascript">document.write(neg_specification_newline('Intel'));</script></TD> 
    </TR> 
    <TR> 
     <TD class="name">Processors Type</TD> 
     <TD class="desc"><script type="text/javascript">document.write(neg_specification_newline('Desktop'));</script></TD>  
    </TR> 
    ... 
    </TABLE> 
</div> 

내림차순가 테이블 셀의 클래스입니다.

원하는 것은이 표의 내용을 추출하는 것입니다.

soup.find(id="pcraSpecs").findAll("td")으로 시작해야합니다.

0

모든 웹 페이지에서 맞춤 RSS 피드를 만드는 데 Feedity - http://feedity.com을 사용해 보았습니까?