4
내가 링크, 양식, 태그 등HTML 구문 분석 라이브러리는 .NET
- http://www.majestic12.co.uk/projects/html_parser.php
- http://www.netomatix.com/Products/DocumentManagement/HtmlParserNet.aspx
- http://www.developer.com/net/csharp/article.php/2230091
LGPL을 추출하기 위해 HTML을 구문 분석 라이브러리를 찾고 있어요 또는 다른 상업적 개발 친화적 라이센스가 바람직합니다.
이 라이브러리 중 하나에 대한 경험이 있습니까? 또는 다른 유사한 라이브러리를 추천 할 수 있습니까?
foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//[email protected]")) {
//...
}
편집 : 단순히 예를 들어 (홈페이지에서), 모든 링크를 찾을 수 -
HTML Agility Pack은 멋지고, 나도 좋습니다. –
동의. 우리는 이것을 프로덕션 환경에서 사용했습니다. 여기서 약 2 년 동안 약 50,000 (X) 개의 HTML 파일을 구문 분석했습니다. 잘됐다. – core
GPL 프로젝트에 대한 권장 사항이 있습니까? HTML 민첩성 팩은 [GPL과 호환되지 않는] Ms-Pl입니다 (https://www.gnu.org/licenses/license-list.html#ms-pl). –