2012-07-23 2 views
0

가능한 중복의 디스플레이 데이터 :
What is the best way to parse html in C#?데이터 읽기, 분석 및 textviews

내가 GET 방식으로의 HttpWebRequest를 사용하는 코드를 작성하기 위해 노력하고있어 (또는 빠른 기능을 제안), 페이지에서 키워드를 찾은 다음 다양한 텍스트 뷰에서 그 뒤에 나오는 것을 표시합니다.

조회하는 홈페이지는 항상 동일하며 항상 같은 줄을 사용하지만 다른 데이터를 찾습니다.

나는 HtmlAgilityPack이라고하는 것을 많이 읽었지 만, 이것을 사용할 수 있는지, 어떻게 사용할 수 있는지는 알 수 없다.

소스 내에서 데이터를 가져오고 찾기 위해 더 빠른 기능이 있습니까?
HtmlAgilityPack을 사용할 수 있습니까? 그렇다면 어떻게해야합니까 (예요)?
더 쉬운 방법이 있습니까? 당신이 태그에서 텍스트를 추출 할 경우

환호
질소 산화물은

+0

아마 ** SO C에 대한 #에서 가장 ** 묻는 질문입니다. [C#에서 HTML을 구문 분석하는 가장 좋은 방법은 무엇입니까?] (http://stackoverflow.com/questions/56107/what-is-the-best-way-to-parse-html-in-c) –

답변

0

예는

HtmlAgilityPack는 "현실 세계"HTML 파일의 읽기/쓰기 DOM을 빌드하는 HTML 파서, HtmlAgilityPack를 사용할 수 있습니다. 그것은 XPATH 또는 XSLT를 지원하고 "현실 세계"는의 실제 데이터를 빠르게 추출하는 데 도움이 XPath 쿼리를 사용

한 줄에 잘못된 HTML에 내성을

+0

태그 바로 뒤, 때로는 태그 외부의 서식없는 텍스트도 HAP에서도 가능합니까? – Noxious

+0

나에게 추출하려는 내용을 html 또는 일반 텍스트로 보여주는 예 – HatSoft