2011-04-21 3 views
1

xml 태그 안에 html이 있고 그걸 파싱 할 수 없습니다. 내가 그 안에 STR 태그는 HTML이 XML을 구문 분석을 시작하면xml 태그 안에 html 태그가있는 xml을 파싱하는 방법

enter image description here

는 사람이 모든 태그와 HTML을 추출에서 나를 도울 수있다. 정상적으로 검색 할 수 있도록

+1

XML을 구문 분석하는 데 사용하는 언어는 무엇입니까? PHP, JavaScript, ...? – mc10

+0

@ mc10 자바를 사용하고 있습니다. – ReNa

+0

시도한 것을 보여주십시오. 또한 이미지가 아닌 실제 XML을 붙여 넣으십시오. 나는 그것을 전혀 읽을 수 없다. –

답변

3

는, CDATA 태그 (<![CDATA[]]>) 내에서 XHTML을 저장하는 것이 좋습니다 :

<str name="body"> 
     <![CDATA[<font face="arial" size="2"><ul><li><p align="justify">india’s first</p></li></ul></font>]]> 
</str> 
0

문제는 HTML하지만 부적절한 HTML 아니다. 이 HTML이 당신의 손에 있다면, 그것이 XHTML을 따르는 지 확인하십시오. 그리고 xml 파서는 이것을 보통 XML로 취급 할 것입니다. 그러나 "HTML Tidy"와 같은 도구를 사용하면 HTML을 수정하고 HTML 파서를 사용할 수 있습니다. 예 : http://www.codeproject.com/KB/dotnet/apmilhtml.aspx

관련 문제