jtidy

0열

1답변

JTidy로 잘못된 형식의 HTML 페이지를 처리하고 있습니다. 특정 태그 집합을 수정하는 데에만 관심이 있습니다 (예 : <img> <table>). JTidy에게 그 태그들에만 집중하라고 말합니까?

2열

3답변

웹 페이지에서 제목 텍스트를 가져 오기 위해 java를 사용하고 있습니다. 나는 다음과 같이 태그 이름을 사용하여 웹 페이지에서 가져온 이미지를 가지고 : 그것은 작동하고 int i=1; InputStream in=new URL("www.yahoo.com").openStream(); org.w3c.dom.Document doc= new Tidy().pa

1열

1답변

xpaths가 Java에서 작동하지 않습니다.

URL에 액세스하고 HTML을 가져 와서 xpaths를 사용하여 특정 값을 얻으려고합니다. 나는 잘 HTML을 받고 있고 Jtidy는 그것을 적절하게 청소하는 것 같다. 그러나 xpaths를 사용하여 원하는 값을 얻으려고하면 빈 NodeList가 다시 나타납니다. 내 xpath 표현이 정확한지 알고 있습니다. 나는 다른 방법으로 그것을 시험했다. 이 코드는

5열

1답변

jTidy 및 TagSoup 설명서

TagSoup 및 jTidy 라이브러리에 대한 설명서 (가능한 경우 공식 문서 가능)가 필요합니다. 이 라이브러리를 사용하여 html (html, xhtml 또는 html5) 태그 사이에 다른 네임 스페이스가있는 xml 태그가 포함 된 html "tagsoup"파일을 조작하고 싶습니다. HTMLCleaner, NekoHTML 및 Jericho를 테스트했지만

8열

2답변

자바를 사용하여 주어진 URL에서 기본 URL을 가져 오는 방법

자바를 사용하여 기본 URL을 가져 오려고합니다. 내 코드에서 jtidy 파서를 사용하여 제목을 가져 왔습니다. jtidy를 사용하여 제대로 제목을 얻고 있지만 주어진 URL에서 기본 URL을 얻지 못하고 있습니다. , 첫 번째 문자열에서 String s1 = "http://staff.unak.is/andy/GameProgramming0910/new_pag

0열

1답변

변형 된 XML/HTML 구문 분석

여러 (약 1600 개의 읽음) HTML 페이지를 구문 분석하고 각 파일에서 다음 태그의 내용을 추출해야합니다. textarea name="line" cols="66" rows="5" class="textbox" id="line" style="font-size:12px;" onkeydown="textCounter()" onkeyup="textCo

0열

2답변

보존 JTidy CSS 규칙

같은 일부 HTML을 촬영합니다. 태그가 최종 출력에서 사라졌습니다.

4열

2답변

JTidy Node.findBody() - 사용 방법?

JTidy로 XHTML DOM 구문 분석을하려고하는데, 직관적이지 않은 것으로 보입니다. 내가 그의 인스턴스를 얻어야한다 어디 Node Tidy.parse(Reader, Writer) 그리고 얻을 수있는 < 몸/그 노드의 >는, 나는 가정, 내가 Node Node.findBody(TagTable) 를 사용한다 : 특히, HTML 구문 분석하는 방법있

3열

2답변

JTidy 업그레이드가 문서 xpaths를 깨뜨림

10 월에 나왔던 jtidy의 최신 버전으로 방금 업데이트되었으며 알려지지 않은 이유로 내 문서 개체가 손상된 것으로 보입니다. 이건 내 코드입니다 : tidy = new Tidy(); tidy.setShowWarnings(false); tidy.setShowErrors(0); tidy.setQuiet(true); tidy.setMakeClean(t

4열

2답변

스프링 서블릿 컨테이너에서 JTidy를 가장 효과적으로 사용하는 방법은 무엇입니까?

Spring Framework를 사용하는 Java 서블릿 컨테이너가 있습니다. Spring을 사용하는 JSP에서 페이지를 생성하여 모든 것을 연결합니다. 결과 HTML을 사용자에게 보내면 내가 원하는만큼 잘 정리되지 않습니다. 클라이언트 브라우저로 보내기 전에 바로 HTML을 Tidy에 보내고 싶습니다. 개발 중이며 프로덕션 환경에서는 사용하지 않도록 설정