2014-01-25 2 views
2

JSP 페이지 문서를 XML 파일로 변환하려고합니다. jsoup를 사용하여 서버 태그를 제외한 전체 내용을 아주 잘 읽었지만 전체 HTML을 XML 태그로 변환하는 방법을 이해할 수 없습니다. 데이터를 한 줄씩 어떻게 가져올 수 있습니까?JSP 페이지를 XML 파일로 파싱하는 방법은 무엇입니까?

내 코드 : 어떤 도움이 모든

+0

왜 라인 단위로 가져 오시겠습니까? 다시 한번 버리면 다시 읽어 들여야합니다. –

답변

0

먼저 좋은 것

File Html=new File("genXML.jsp"); 
Document doc=Jsoup.parse(Html,"UTF-8","http://www.example.com"); 
System.out.println(doc.html()); 

, 그것은 HTML을 XML로 변환하여 XML로 JSP를 변환 동일하지 않습니다. JSP에서 생성 된 HTML을 XML로 변환하려고한다고 가정합니다. 둘째로, 당신은 이것을 한 줄씩하고 싶지 않습니다. HTML 블록은 대개 한 줄로 시작하고 끝나지 않습니다.

어쨌든 tagsoup 같은 도구를 사용하여 HTML 코드를 XHTML로 변환 할 수 있습니다. XHTML은 실제로 XML입니다. Tagsoup를 호출하여 번역 할 수 있습니다. 나는 그것이 usefule의 API가 있는지 모르겠지만, 적어도 그것은 같은 것을 사용하여 외부 프로세스로 사용자 코드에서 호출 할 수 있습니다 : 당신이 목표 XML 스키마로 변환하려면 다음

Process tr = Runtime.getRuntime().exec(new String[]{ "..." }); 

을 온라인에서 찾은 도구 (thisthis 확인)를 사용하여 XSLT 변형을 적용 할 수 있습니다. JAXP을 사용하여 프로그래밍 방식으로 XSLT 변환을 적용 할 수 있습니다.

희망이 있습니다.

+0

파서가 필요합니다. 코드를 쓰고 있습니다. 이들은 소프트웨어입니다. – Nirupom

+0

수정 된 답변을 확인하십시오. API를 찾지 못했지만 프로그래밍 방식으로 제안하는 도구를 사용할 수 있다고 가정합니다. –

+0

웹 사이트 http://jsoup.org/을 통해 jsp 대신 HTML을 변환하는 방법을 발견했습니다. 그러나 siblingElements, nextElementSibling, firstElementSibling 등을 사용하는 방법을 찾을 수 없습니다. – Nirupom

관련 문제