HTML 문자열을 가져 와서 유용하게 사용할 수있는 가장 좋은 방법은 무엇입니까?일반적으로 HTML을 구문 분석하는 C#?
기본적으로 URL을 가져 와서 .net에서 해당 URL의 HTML을 가져 오는 경우 응답이 표시되지만 파일이나 스트림 또는 문자열 형태로 표시됩니다.
실제 문서 나 XmlDocument 개체처럼 크롤링 할 수있는 콘텐츠를 원한다면 어떻게해야합니까?
나는이 문제에 대해 몇 가지 생각과 이미 구현 된 해결책을 가지고 있지만 커뮤니티가 이것을 어떻게 생각하는지보고 싶습니다.
왜 XML 파싱을 위해 .NET 라이브러리를 사용하지 않는가? – Joren
lol 나는 당신이 말한 것을 믿을 수 없다 ... html은 xml이 아니며 유효한 HTML을 만드는 특정 것들은 유효한 XML이 아니며 작동하지 않을 것이다. – War