webharvest

1열

2답변

사이트 맵이없는 웹 사이트의 URL을 추출하려고합니다. 나는이 코드를 사용하고있다. Web Harvest tool 자바 나 코딩에 대해서는 잘 모른다. 누군가이 도구를 사용하여 나를 도울 수 있었습니까? 특정 웹 사이트 (예 : example.com)에서 실행하고 해당 웹 사이트의 모든 단일 URL을 추출하고 싶습니다.

0열

1답변

xpst0003 xquery 구문 오류

x 쿼리 코드를 통해 webpage을 쿼리하고 싶습니다. 도와주세요. 그리고 다음 오류가 발생합니다 : XPST0003 : XQuery 구문 오류가 # ... // json // sentences // trans); # : 예상 "return", found ";". <?xml version="1.0" encoding="UTF-8"?> <config cha

1열

1답변

Webharvest if/else 및 try/catch 항상 성공

웹 사이트에서 일부 데이터를 수집해야하는 프로젝트에서 작업 중이므로 webharvest를 사용하고 있습니다. 내가 수집하는 데이터 (뉴스 웹 사이트의 의견)가 여러 페이지에 걸쳐 나타나는 문제가 있습니다. 웹 페이지의 xpath에있는 주석의 두 번째 페이지에 대한 링크를 찾도록 구성하려고합니다. 문제는 내가 if 테스트를 시도하면 조건이 항상 통과하고 tr

0열

1답변

WebHarvest에서 변수에 숫자 추가하기

나는 자바 스크립트를 처음 사용한다고 말하기 시작해야한다. 숫자를 기준으로 webharvest에 여러 개의 URL을 피드해야합니다. 이유는 오래지만, 내 URL 구조는 다음과 같습니다. http://www.example.com/foo/bar?page=0. ?page=은 각 단계마다 25 씩 증가합니다. 다음 페이지는 http://www.example.com

0열

1답변

WebHarvest가 하나의 요청으로 결과 50 개 필요

나는이 언어로 새로운데, 나는 간단한 작업에 빠져있다. 기본적으로 검색자가 기본 결과로 제공하는 10 가지 기본 검색 결과 대신 50 가지 검색 결과를 얻고 싶습니다. 이 코드가 될 것입니다! <include path="functions.xml"/>  <var-

-1열

1답변

제한 목록이 xpath에 의해 반환 됨

WebHarvest에서 xpath를 사용하려고하는데 큰 데이터 목록을받을 수는 있지만 처음 5 개의 문자열 만 반환하면됩니다. <var-def name="googleProducts"> <html-to-xml> <http url="http://google.com/shopping?q=fila skele-toes&hl=en"/>

0열

2답변

웹 수확을 통한 하위 링크의 데이터 수집

Web Harvest의 하위 링크에서 데이터를 수집 할 수있는 방법이 있습니까? 다음은 는 XML 세그먼트는 내가 사용된다 <loop item="item" index="i"> <list><var name="products"/></list> <body> <xquery> <xq-param name="ite

1열

1답변

WebHarvest - 인증을 사용하여 데이터 스크랩

WebHarvest 도구를 사용하여 일부 웹 사이트의 웹 데이터를 스크랩합니다. 예제를 살펴 보았지만 웹 사이트에서 인증 한 다음 데이터를 스크랩 핑 할 수있는 방법을 찾을 수 없었습니다. 누구든지 인증을 통해 웹 데이터를 긁어 모으기 위해 예제 구성을 인용 할 수 있습니까? 로그인 매개 변수를 보내고 홈페이지 내용을 수신하려면 어떻게해야합니까? 이것에 대

0열

2답변

각도 4 json 개체로 웹 페이지 콘텐츠를 요청하는 방법

http 호출이있는 웹 페이지를 요청하고 데이터를 수집하려고합니다. 크롬 플러그인과 교차 출처를 피할 수 있지만 요청을하면 응답은 항상 "null"입니다. 각도 응용 프로그램 내에서 json 객체로 html 페이지를 가져올 수 있습니까? 이것은 마임가 자동으로 입력 정렬합니다 http://www.hurriyet.com.tr/gundem/gundem.json

0열

1답변

Java에서 인코딩 헤더 문제 받기

Webharvest를 사용하여 웹 사이트에서 파일을 다운로드하고 원래 이름을 사용합니다. 내가 함께 일하고 자바 코드는 다음과 같습니다 import org.apache.commons.httpclient.Header; import org.apache.commons.httpclient.HttpClient; import org.apach