2014-11-22 2 views
0

웹 스크래퍼 (또는 화면 스크레이퍼를 보려는 경우)를 작성해야합니다. 나는 HtmlAgilityPack를 발견했습니다하지만 난 완전히 해요로 표시 할 샘플 코드가있어이 때 내가 전화 번호 같은 것들을 추출 얼마나 HTML의 다음 샘플 및웹 페이지 구문 분석 및 데이터 추출

<td valign="top" class="clsContent" style="width: 250px; padding-right: 21px"> 
    <span class=clsLabelB>Web: </span><a href='http://www.marriott.com/hotels/travel/sandm-san-diego-marriott-del-mar/' target=_blank>http://www.marriott.com/hotels/travel/sandm-san-diego-marriott-del-mar/</a><br /> 
    <div style='padding-top:7px'> 
     <table cellpadding=0 cellspacing=0> 
      <tr> 
       <td valign=top class=clsLabelB nowrap>Phone:&nbsp;&nbsp;</td> 
       <td valign=top>+1 858-523-1700</td> 
      </tr> 
      <tr> 
       <td valign=top class=clsLabelB nowrap>Fax:&nbsp;&nbsp;</td> 
       <td valign=top>+1 858-523-1355</td> 
      </tr> 
      <tr> 
       <td valign=top class=clsLabelB nowrap>Toll Free:&nbsp;&nbsp;</td><td valign=top>800-228-9290</td> 
      </tr> 
     </table> 
    </div> 
    <p><span class=clsLabelB>Chain: </span><a href='/Hotels/Companies/Marriott-International'>Marriott International</a><br /> 
    <span class=clsLabelB>Chain Website: </span><a href='http://www.marriott.com' target=_blank>http://www.marriott.com</a> 
    <p><span class=clsLabelB>Description: </span>Contemporary high-rise hotel - Convenient to area companies, beaches, golf, shopping, San Diego Zoo and Sea World.<br /> 
    <div style='padding-top:7px'> 
     <table cellpadding=0 cellspacing=0> 
      <tr> 
       <td valign=top class=clsLabelB width=170px nowrap>Year Renovated:&nbsp;&nbsp;</td> 
       <td valign=top>2003</td> 
      </tr> 
     </table> 
    </div> 
    <div style='padding-top:7px'> 
     <table cellpadding=0 cellspacing=0> 
      <tr> 
       <td valign=top class=clsLabelB width=170px nowrap>Check in Time:&nbsp;&nbsp;</td> 
       <td valign=top>4:00 PM</td> 
      </tr> 
      <tr> 
       <td valign=top class=clsLabelB width=170px nowrap>Check out Time:&nbsp;&nbsp;</td> 
       <td valign=top>12:00 PM</td> 
      </tr> 
      <tr> 
       <td valign=top class=clsLabelB width=170px nowrap>Number of Floors:&nbsp;&nbsp;</td> 
       <td valign=top>11</td> 
      </tr> 
      <tr> 
       <td valign=top class=clsLabelB width=170px nowrap>Total Number of Rooms:&nbsp;&nbsp;</td> 
       <td valign=top>284</td> 
      </tr> 
     </table> 
    </div> 
</td> 

주어진 궁금 이 하나에 붙어, 어떤 도움이나 도움을 크게 주시면 감사하겠습니다. 당신은이 같은 시도

답변

1

, 이것은 내가 찾던 그냥 뭐 샘플 코드

HtmlDocument doc = new HtmlDocument(); 
    doc.Load("file.html"); 
    string phone_number = doc.DocumentElement.SelectNodes("//td[contains(text(), 'Phone')]//following-sibling::td[1]"]).InnerText 
+0

감사 @Tasawer이다. – PsychoCoder

관련 문제