나는 파서를 ASP.NET
에 C#
과 함께 사용하여 Times 웹 사이트의 기사에서 주석을 파싱/가져 오려고합니다. 다음은 샘플 URL입니다. http://timesofindia.indiatimes.com/tech/tech-news/software-services/Infosys-CEO-SD-Shibulals-letter-to-employees/articleshow/16832881.cms
HTML Parser를 사용하여 주석을 가져 오는 방법은 무엇입니까?
나는 그 HTML을 가져 와서 WebGet
, DocumentNode.SelectNodes()
등을 사용하여 주석을 가져 오려고했습니다. 그러나 그것의 HTML에있는 어떤 코멘트도 보여주지 않기.
(일반적으로 모든 데이터 일부 <div>
태그 등에 포함 설립 가져 그러나 여기에서 그런 태그는 의견을주는 사용할 수 없습니다합니다.)
어떻게이 페이지에서 주석을 가져올 수 있습니까?
도움이 될만한 정보는 다음과 같습니다. http://htmlagilitypack.codeplex.com/ HTML에서 특정 정보를 쉽게 파싱 할 수 있습니다. – MisterIsaak
실제 댓글이있는 URL이 있습니까, 귀하의 게시물에있는 URL에 댓글이 없습니까? 아마도 댓글이 사이트에서 동적으로 업데이트됩니다. 그래서 html 코드를 가져 오는 경우 주석이 없습니다. – urlreader
HtmlAgilityPack을 사용하여 주석을 얻을 수 없습니다. JavaScript를 사용하여 주석이로드되기 때문입니다 (먼저 JS를 실행해야합니다). – Nasreddine