2010-02-23 5 views
1

웹 URL이 주어지면 WEBSITE에있는 모든 링크를 감지하고 내부 링크를 식별하여 나열하고 싶습니다.웹 페이지의 모든 앵커 태그 얻기

  WebClient webClient = null; 
      webClient = new WebClient(); 

      string strUrl = "http://www.anysite.com"; 
      string completeHTMLCode = ""; 

      try 
      { 
       completeHTMLCode = webClient.DownloadString(strUrl); 
      } 
      catch (Exception) 
      {      
      } 

I 페이지의 내용을 읽을 수있는이 사용 ....하지만 난 내 마음에있는 유일한 아이디어를 찾고 ....이 문자열을 구문 분석 :

는 내가 가지고있는 것은 이것이다 <a 다음 href 큰 따옴표 사이의 값입니다.

유일한 방법입니까? 아니면 다른 좋은 해결책이 있습니까?

답변

2

HtmlAgilityPack

completeHTMLCode = 
    webClient.DownloadString(strUrl); 

doc.Load(completeHTMLCode); 
foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@a"]) 
{ 
    // 
}