jtidy

    0

    1답변

    JTidy로 잘못된 형식의 HTML 페이지를 처리하고 있습니다. 특정 태그 집합을 수정하는 데에만 관심이 있습니다 (예 : <img> <table>). JTidy에게 그 태그들에만 집중하라고 말합니까?

    2

    3답변

    웹 페이지에서 제목 텍스트를 가져 오기 위해 java를 사용하고 있습니다. 나는 다음과 같이 태그 이름을 사용하여 웹 페이지에서 가져온 이미지를 가지고 : 그것은 작동하고 int i=1; InputStream in=new URL("www.yahoo.com").openStream(); org.w3c.dom.Document doc= new Tidy().pa

    1

    1답변

    URL에 액세스하고 HTML을 가져 와서 xpaths를 사용하여 특정 값을 얻으려고합니다. 나는 잘 HTML을 받고 있고 Jtidy는 그것을 적절하게 청소하는 것 같다. 그러나 xpaths를 사용하여 원하는 값을 얻으려고하면 빈 NodeList가 다시 나타납니다. 내 xpath 표현이 정확한지 알고 있습니다. 나는 다른 방법으로 그것을 시험했다. 이 코드는

    5

    1답변

    TagSoup 및 jTidy 라이브러리에 대한 설명서 (가능한 경우 공식 문서 가능)가 필요합니다. 이 라이브러리를 사용하여 html (html, xhtml 또는 html5) 태그 사이에 다른 네임 스페이스가있는 xml 태그가 포함 된 html "tagsoup"파일을 조작하고 싶습니다. HTMLCleaner, NekoHTML 및 Jericho를 테스트했지만

    8

    2답변

    자바를 사용하여 기본 URL을 가져 오려고합니다. 내 코드에서 jtidy 파서를 사용하여 제목을 가져 왔습니다. jtidy를 사용하여 제대로 제목을 얻고 있지만 주어진 URL에서 기본 URL을 얻지 못하고 있습니다. , 첫 번째 문자열에서 String s1 = "http://staff.unak.is/andy/GameProgramming0910/new_pag

    0

    1답변

    여러 (약 1600 개의 읽음) HTML 페이지를 구문 분석하고 각 파일에서 다음 태그의 내용을 추출해야합니다. textarea name="line" cols="66" rows="5" class="textbox" id="line" style="font-size:12px;" onkeydown="textCounter()" onkeyup="textCo

    0

    2답변

    같은 일부 HTML을 촬영합니다. 태그가 최종 출력에서 ​​사라졌습니다.

    4

    2답변

    JTidy로 XHTML DOM 구문 분석을하려고하는데, 직관적이지 않은 것으로 보입니다. 내가 그의 인스턴스를 얻어야한다 어디 Node Tidy.parse(Reader, Writer) 그리고 얻을 수있는 < 몸/그 노드의 >는, 나는 가정, 내가 Node Node.findBody(TagTable) 를 사용한다 : 특히, HTML 구문 분석하는 방법있

    3

    2답변

    10 월에 나왔던 jtidy의 최신 버전으로 방금 업데이트되었으며 알려지지 않은 이유로 내 문서 개체가 손상된 것으로 보입니다. 이건 내 코드입니다 : tidy = new Tidy(); tidy.setShowWarnings(false); tidy.setShowErrors(0); tidy.setQuiet(true); tidy.setMakeClean(t

    4

    2답변

    Spring Framework를 사용하는 Java 서블릿 컨테이너가 있습니다. Spring을 사용하는 JSP에서 페이지를 생성하여 모든 것을 연결합니다. 결과 HTML을 사용자에게 보내면 내가 원하는만큼 잘 정리되지 않습니다. 클라이언트 브라우저로 보내기 전에 바로 HTML을 Tidy에 보내고 싶습니다. 개발 중이며 프로덕션 환경에서는 사용하지 않도록 설정