2012-03-19 3 views
-1

this page을 참조하십시오.HTML 파일 본문 태그를 읽는 방법

HTML을 읽을 수 있지만 <Body> 태그를 선택하여 패널에 표시하고 싶습니다.

이 코드 작성했습니다

". 널 finalhtml 본체 null 값"

WebRequest req = WebRequest.Create("http://www.taxmann.com/taxmannflashes/whatsnew.aspx?sid=9578&stype=1"); 

WebResponse res = req.GetResponse(); 

StreamReader sr = new StreamReader(res.GetResponseStream()); 
string htmlResp = sr.ReadToEnd(); 
String htmlBody = ""; 

if (htmlResp.ToLower().Contains("<div id=\"dvreadmore\">")) 
{ 
    int startIndex = htmlResp.ToLower().IndexOf("<div id=\"dvreadmore\">"); 
    int lastIndex = htmlResp.ToLower().IndexOf("</html>\n</div>"); 
    if (lastIndex == -1) 
    { 
     lastIndex = htmlResp.ToLower().IndexOf("</html></div>"); 
    } 
    htmlBody = htmlResp.Substring(startIndex + 21, lastIndex + 7); 
    String final = htmlBody; 
} 

내가 값을 얻고을 <Body> 태그를 선택하고 싶습니다.

내가 뭘 잘못하고 있으며 어떻게 해결할 수 있습니까?

답변

1

htmlagilitypack.codeplex.com을 사용하여 HTML을 읽는 것이 좋습니다. 또한 너겟을 통해 설치할 수 있습니다.

관련 문제