나는 그런 thenextweb.com, mashable.com 및 readwriteweb.com 등 최고 기술 웹 사이트 긁힌 자국 웹 사이트를 설계C#에서 htmlagilitypack을 사용하여 웹 페이지에서 링크 및 게시물을 추출하는 방법은 무엇입니까?
은 이제 HTML을 민첩성 팩을 사용하여 폐기하는 한 가지 방법은 하나 개의 웹 사이트가 thenextweb.com하자 복용하고 있어요 <tags>
에 따라 기사 링크 및 콘텐츠를 가져옵니다. 즉, <div class ="article-listing"> ..... </div>
을 사용하고 링크를 가져옵니다. 각 웹 사이트마다 동일한 방식으로 디자인 알고리즘을 사용합니다 (태그는 각 웹 사이트마다 다릅니다). 여기
var webGet = new HtmlWeb();
var document = webGet.Load(url);
var infos = from info in
document.DocumentNode.SelectNodes("//div[@class='article-listing']")
select new
{
Contr = info.InnerHtml
};
lvLinks.DataSource = infos;
lvLinks.DataBind();
(게시물과 이미지, 날짜 등) ?
감사하지만 이것은 내가하고 싶은 것이 아닙니다. – ItsLockedOut
@iKunu - 질문을 편집하고 필요한 내용을 정확히 설명 할 수 있으며 문제가 해결되지 않는 이유는 무엇입니까? RSS는 사이트에서 이야기를 얻는 가장 좋은 방법입니다 ... – Kobi
: 모든 이야기에 필요한 일부 잘라 내기가 있습니다 ... 그래서 웹 페이지에서만 가져올 수 있습니다. 하지만 지금은 그 일을 할 길을 찾았습니다. 감사 – ItsLockedOut