href에서 링크를 추출하려고합니다. <a class="p_l" href="" id="0" target="_blank">
이것은 페이지 뷰 소스에 표시되지만 방화 광을 사용하여 검사 할 때 href에는 http://home.website.com/preview/preview?uname=3eadsf132sdas
이 포함됩니다. htmlagilitypack을 사용했지만 href가 null을 반환했습니다. href에서 링크를 추출하는 방법. 당신이 그것을 당신은 WebRequest 클래스 클래스를 사용하여 HTML 콘텐츠를 받고 같은 다른 무언가를 시도 할 수 이러한 방법href 콘텐츠를 얻는 방법
HtmlAgilityPack.HtmlDocument htmlDoc = new HtmlAgilityPack.HtmlDocument();
htmlDoc.OptionFixNestedTags=true;
htmlDoc.Load(filePath);
foreach(HtmlNode link in htmlDoc.DocumentElement.SelectNodes("//a[@href"])
{
if(link != null)
{
if(link["href"] != null)
{
HtmlAttribute att = link["href"];
var url = att.Value;
}
}
빈 href는 "현재 URL이 무엇이든"을 의미하기 때문입니다. 민첩성 팩은 어디에서 HTML을 가져 왔는지 알 수 없습니다. – Jon
링크를 추출 할 수 있습니까? href에서 링크를 얻는 방법. – Maddy
@Maddy는 첫 번째 주석 작성자의 말을 되풀이하여 추출 할 내용이 없습니다. Firebug는 * 웹 브라우저가 알고있는 것을 보여줍니다. HTML 민첩성 팩은 * HTML 소스 *가 알고있는 것만 알고 있습니다. 브라우저는 HTML이로드 된 곳을 알고 있습니다. Html Agility Pack은 HTML을로드하지 않습니다. 방화범을 쳐다 보지 말고 "뷰 소스"를보십시오. 그것이 HAP이 실제로 보는 것입니다. –