2012-03-09 2 views
1

저는 jsoup을 사용하여 웹 사이트에서 링크를 추출합니다. 나는 하나의 지정된 링크 containg 지정된 링크를 추출 싶습니다. 나는 키워드 "다운로드"를 포함하는 링크를 검색하고 싶습니다. 그것을하는 방법. 다음 코드가 있습니다일부 문자열이 포함 된 jsoup 문서의 링크를 다른 문자열로 추출합니다.

Document doc = Jsoup.parse(new URL("http://www.examplesite.com)); 
Element link = doc.select("a").first(); 

답변

3

선택기 구문에 대해서는 here을 참조하십시오.

노드 내의 텍스트를 :contains으로 테스트 할 수 있습니다 (예 : :contains). Element link = doc.select("a:contains(Download)").first();. 원하는 경우 :matches을 정규식으로 사용할 수 있습니다.

attr 방법을 통해 링크 주소를받습니다. String linkaddress = link.attr("href");.

+0

사용이 포함 된 링크를 얻으려면 내가하고 싶은 사용할 수 있습니다.? –

+0

이 문서에서 일치 (jsoup는 두 개의 링크, 동일한 링크를 찾습니다.) 첫 번째 문자열 만 가져 와서 문자열로 변환 할 수 있습니까? 고맙습니다 –

0

당신은 문자열로 변환이

elements with attributes that start with [attr^=value],end with [attr$=value],contain the value [attr*=value] e.g. [href*=/path/] 

특정 단어가이

org.jsoup.select.Elements links = doc.select("[href*=download]"); 
관련 문제