2012-11-30 6 views
11

BeautifulSoupC#에 대한 유사한 라이브러리가 있습니까?BeautifulSoup는 C와 유사합니다

HTML과 XML, 특히 오류가있는 HTML을 간단하게 구문 분석하려고합니다.

+0

저는 이것을 (약 5/6 년 전에!?) http://htmlagilitypack.codeplex.com/ 전에 간략하게 사용했습니다. 그리고 내가 필요로하는 것에 대해서는 괜찮 았지만 광범위하게 테스트하거나 통과시켜야했습니다. 그 보행 ... –

+0

http://developer.mindtouch.com/SgmlReader 나는 과거에 HTML을 파싱하기 위해 이것을 사용 해왔다. 꽤 의심스러운 HTML로 꽤 안정적입니다. – Pete

답변

8

나는 약간의 성공과 함께 과거에 HTMLAgilityPack을 사용했으나 잘못 구성된 HTML을 분석하거나 닫는 태그가없는 문제가있었습니다. 그러나 그것은 약 2 년 전이었다.

저는 일반적으로 SGMLReader을 사용하는 경향이 있습니다. SGMLReader을 사용하면 XML 판독기로 래핑 할 수 있으므로 C#의 XDocument 또는 XmlDocument를 사용하여 HTML을 읽을 수 있습니다. SGMLReader는 내가 조작 한 모든 잘못된 HTML을 처리했습니다.