jsoup

    3

    1답변

    이 선택 문이 효율적 일지 궁금하네요. elements = document.body().select("[data-custom-attr=blahblah]"); JSoup가 모든 요소 속성 및 값에 대한 맵을 작성하여 효율적으로 검색 할 수 있습니까? 아니면 이것의 트래버스가 포함될 수 있습니까? 전체 문서?

    1

    2답변

    웹 페이지에서 데이터를 검색하고 긁어 데이터베이스에 저장하는 데 유용한 오픈 소스 Java 라이브러리는 무엇입니까? <tr><td><b>Address:</b></td> <td colspan=3>123 My Street </td></tr> "주소 :"예를 들어, 내가 같은 페이지가 있다고 가정의 핵심이지만, 사실 그 사이에 html 태그 및 공간의 무

    1

    2답변

    Jsoup를 사용하여 다운로드 한 파일을 인쇄하려면 줄 바꿈이 있으면 DocType의 일부 정보가 누락됩니다. 이것은 의도 된 버그입니까, 아니면 버그입니까? 예를 들어 는 : <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtm

    1

    1답변

    html 페이지를 구문 분석하는 프로그램을 만들었습니다. ThreadPool 내에서 호출 가능한 클래스 내에서 jsoup connect 함수를 사용합니다. 문제는 내가 동일한 웹 사이트에 연결하고 스레드 풀 크기가 5+ 이상인 경우 IO 예외 - 400 오류가 발생한다는 것입니다. 어떻게 그렇게하지 않습니까?

    0

    1답변

    Jsoup를 사용하여 웹 페이지에서 전체 의견 수를 추출하려고합니다. 는 예를 들어, 다음 페이지 (현지 시간)입니다 : http://edition.cnn.com/2011/POLITICS/07/31/debt.talks/index.html?hpt=T1 내가 클래스 ID가 cnn_strycmtsndff 것을 볼 수 있지만 그것을 추출 할 수있는 권리 명령을 찾

    2

    1답변

    누락 된 HTML 태그 (시작 태그 또는 종료 태그)가 하나라도있을 때 Jsoup의 기본 동작은 무엇입니까? 오류가 발생하거나 기존 태그를 무시하거나 기존 태그를 제거합니까?

    0

    1답변

    JSOUP을 사용하여 웹 페이지에서 SELECT 노드를 가져 오려고합니다. 문제는 SELECT 노드 안에 첫 번째 OPTION 노드가 생겼다는 것입니다. 위에서 언급 한 웹 페이지에 대한 HTML 소스 코드를 검사했을 때 SELECT 노드 안에 9 개의 OPTION 노드가 있다는 것을 알았습니다. 이것은 내가 사용하고있는 자바 코드입니다 : Document

    1

    1답변

    가 그때 내 웹 응용 프로그램이 일부 수정하여 다시 HTML 페이지를 다시 표시합니다 다음 명령 Document doc = Jsoup.connect(url).post(); 를 사용 그것은 잘 작동 HTML 페이지를 읽어 웹 응용 프로그램을하고있는 HTML을 읽는 시간 초과 나는 그것을 제공한다. 그러나 일부 프로그램은 내 프로그램에서 허용하지 않았습니다

    2

    1답변

    Jsoup는 HTML을 스크랩하는 데 아주 좋은 라이브러리 인 것처럼 보이지만 유감스럽게도 해당 API에는 사실상 아무 문서도 없습니다. 내가 머리 또는 꼬리를 구현하는 것이 왜 http://jsoup.org/apidocs/org/jsoup/select/NodeVisitor.html 당신이 어떤 데이터 구조체와 알고리즘 여기에 함축되고 있는지 머리와 꼬리

    6

    1답변

    어떻게 이것들을 제거 할 수 있습니다 내 JSoup '문서'에서 <td> </td> 또는 <td width="7%"> </td> ? 나는 많은 방법을 시도했지만, 이러한 획기적인 공백 문자는 일반 JSoup 표현식이나 선택자와 일치하지 않습니다.