webharvest

    1

    2답변

    사이트 맵이없는 웹 사이트의 URL을 추출하려고합니다. 나는이 코드를 사용하고있다. Web Harvest tool 자바 나 코딩에 대해서는 잘 모른다. 누군가이 도구를 사용하여 나를 도울 수 있었습니까? 특정 웹 사이트 (예 : example.com)에서 실행하고 해당 웹 사이트의 모든 단일 URL을 추출하고 싶습니다.

    0

    1답변

    x 쿼리 코드를 통해 webpage을 쿼리하고 싶습니다. 도와주세요. 그리고 다음 오류가 발생합니다 : XPST0003 : XQuery 구문 오류가 # ... // json // sentences // trans); # : 예상 "return", found ";". <?xml version="1.0" encoding="UTF-8"?> <config cha

    1

    1답변

    웹 사이트에서 일부 데이터를 수집해야하는 프로젝트에서 작업 중이므로 webharvest를 사용하고 있습니다. 내가 수집하는 데이터 (뉴스 웹 사이트의 의견)가 여러 페이지에 걸쳐 나타나는 문제가 있습니다. 웹 페이지의 xpath에있는 주석의 두 번째 페이지에 대한 링크를 찾도록 구성하려고합니다. 문제는 내가 if 테스트를 시도하면 조건이 항상 통과하고 tr

    0

    1답변

    나는 자바 스크립트를 처음 사용한다고 말하기 시작해야한다. 숫자를 기준으로 webharvest에 여러 개의 URL을 피드해야합니다. 이유는 오래지만, 내 URL 구조는 다음과 같습니다. http://www.example.com/foo/bar?page=0. ?page=은 각 단계마다 25 씩 증가합니다. 다음 페이지는 http://www.example.com

    0

    1답변

    나는이 언어로 새로운데, 나는 간단한 작업에 빠져있다. 기본적으로 검색자가 기본 결과로 제공하는 10 가지 기본 검색 결과 대신 50 가지 검색 결과를 얻고 싶습니다. 이 코드가 될 것입니다! <include path="functions.xml"/> <!-- The phrase to search for in the 4shared API --> <var-

    -1

    1답변

    WebHarvest에서 xpath를 사용하려고하는데 큰 데이터 목록을받을 수는 있지만 처음 5 개의 문자열 만 반환하면됩니다. <var-def name="googleProducts"> <html-to-xml> <http url="http://google.com/shopping?q=fila skele-toes&hl=en"/>

    0

    2답변

    Web Harvest의 하위 링크에서 데이터를 수집 할 수있는 방법이 있습니까? 다음은 는 XML 세그먼트는 내가 사용된다 <loop item="item" index="i"> <list><var name="products"/></list> <body> <xquery> <xq-param name="ite

    1

    1답변

    WebHarvest 도구를 사용하여 일부 웹 사이트의 웹 데이터를 스크랩합니다. 예제를 살펴 보았지만 웹 사이트에서 인증 한 다음 데이터를 스크랩 핑 할 수있는 방법을 찾을 수 없었습니다. 누구든지 인증을 통해 웹 데이터를 긁어 모으기 위해 예제 구성을 인용 할 수 있습니까? 로그인 매개 변수를 보내고 홈페이지 내용을 수신하려면 어떻게해야합니까? 이것에 대

    0

    2답변

    http 호출이있는 웹 페이지를 요청하고 데이터를 수집하려고합니다. 크롬 플러그인과 교차 출처를 피할 수 있지만 요청을하면 응답은 항상 "null"입니다. 각도 응용 프로그램 내에서 json 객체로 html 페이지를 가져올 수 있습니까? 이것은 마임가 자동으로 입력 정렬합니다 http://www.hurriyet.com.tr/gundem/gundem.json

    0

    1답변

    Webharvest를 사용하여 웹 사이트에서 파일을 다운로드하고 원래 이름을 사용합니다. 내가 함께 일하고 자바 코드는 다음과 같습니다 import org.apache.commons.httpclient.Header; import org.apache.commons.httpclient.HttpClient; import org.apach