2011-09-29 3 views
2

자바 애플리케이션을 작성하고 있습니다. Rome lib를 사용하여 웹 사이트 RSS 파일의 RSS 피드를 읽습니다. 로마를 사용하여 피드를 읽고 관리 할 수 ​​있지만 RSS 파일의 정확한 URL 경로를 찾을 수 없습니다.java : 웹 사이트의 RSS 파일을 찾으십시오.

<link rel="alternate" type="application/rss+xml" href="/rss.ashx" title="Rss feed for yourdomain.com" />

RSS 파일, 자바에서 URL 경로를 찾을 수있는 깨끗한 방법은 무엇입니까 : 나는 라인이 RSS XML 파일의 URL을 지정하는 HTML 파일에서 다음과 같이이 알아?

당신은 <link /> -node을 얻고 href 속성을 추출하기 위해 HTML 페이지에 XPath 식을 사용할 수 있습니다 당신에게 모든

+2

같은 것을 어쩌면 당신을 위해 관련 사용 http://stackoverflow.com/questions/4144529/how-to-extract-absolute-url-from-relative-html-links- using-jsoup –

답변

3

감사합니다. 상자 밖에서 이것은 잘 형식화 된 XHTML 페이지에서만 작동합니다. xpath를 적용하기 전에 문서를 수정해야 할 수도 있습니다.

아니면 http://jsoup.org/

관련 문제