2014-12-02 1 views
1

내 Vala 응용 프로그램에서 LibXML을 사용하여 HTML 코드를 구문 분석합니다. 그러나 유효성 검사기를 통해 전달하는 경우 브라우저에서 정상적으로 표시되지만 사용하는 HTML은 유효하지 않습니다. 이 HTML에서는 일부 태그가 닫히지 않습니다. 그들은 <img /> 대신 <img>을 사용하고 <meta/> 대신 <meta>을 사용합니다. 그것에 대해 아무 것도 할 수 없습니다. 유효한 HTML을 작성하도록 요청하십시오. 하지만 그것을 구문 분석하고 libxml2이 작업을 수행 할 실패합니다 (즉, doc->get_root_element() 항상 null 반환).libxml2가 비 엄격 HTML을 구문 분석하는 방법은 무엇입니까?

libxml2가 유효하지 않은 HTML을 구문 분석 할 수 있습니까?

답변

1

HTML은 XML이 아닙니다. 사람들은 XML (XHTML이라고 불렀습니다)을 만들려고 노력했으며, 사람들이 유효한 XML을 작성할 수 없다는 사실을 대부분 배웠습니다. 그것이 유효하지 않다고 말하면, 유효하지 않다는 것을 의미한다고 가정합니다. XML 사실, 유효한 HTML입니다.

libxml에는 HTML 파서가 포함되어 있으므로이를 사용해야합니다. Vala에서는 모든 것이 Html 네임 스페이스에 있습니다.

+0

이해해 주셔서 감사합니다. – serge1peshcoff

관련 문제