URL의 페이지 제목을 얻기 위해 Groovy로 작성한 코드입니다. 그러나 일부 웹 사이트에서 "Moved Permanently"을 얻었습니다. 301 리디렉션 때문에 이것이라고 생각합니다. 나는이 문제를 방지하고 내가 대신 올바른 페이지 제목 http://www.nytimes.com/2011/08/14/arts/music/jay-z-and-kanye-wests-watch-the-throne.htmlHttpUrlConnection은 컨텐트의 제목을 가져오고 "Movated Permanently"을 받았습니다.
def con = (HttpURLConnection) new URL(url).openConnection()
con.connect()
def inputStream = con.inputStream
HtmlCleaner cleaner = new HtmlCleaner()
CleanerProperties props = cleaner.getProperties()
TagNode node = cleaner.clean(inputStream)
TagNode titleNode = node.findElementByName("title", true);
def title = titleNode.getText().toString()
title = StringEscapeUtils.unescapeHtml(title).trim()
title = title.replace("\n", "");
return title
나는 그것을 시도했지만 여전히 작동하지 않았다. 그리고 setInstainceFollowRedirects (true)가 기본값이라고 생각합니다. 하지만 고맙습니다. 답장을 보내 주시면 감사하겠습니다. – toy
그래, 내가 게시하기 전에 자신을 시도해야합니다. 나는 당신의 증상을 재현했지만 아직 그 이유를 알지 못합니다. 나는 HttpUrlConnection 대신에 HttpBuilder를 시도했고, additonal 설정없이 리다이렉트를 따른다. 그러나 결과물을 HtmlCleaner로 전달할 수 없었습니다. – mmigdol
그것은 영향을 미치지 않는 페이 월이 아닙니까? –