2013-03-22 4 views
0

웹 포털에서 데이터를 수집하기 위해 셀레늄을 사용하고 있습니다. 데이터는 XML 형식이지만 URL 확장자는 .xml이 아니며 도트이므로 .aspx로 표시됩니다 순 website.Now 사용하여 셀레늄 나는셀렌을 사용하여 페이지 내용 저장하기

driver.getPageSource()를 사용하여 페이지 소스를 얻을 수 그러나 여기에 XML을 HTML.Separating HTML을 사용하여 나에게 형식을 제공합니다 정말 고통이고 나는 그런 JSoup 많은 옵션을 시도하지만, 완료 될 파싱이 너무 많아 보인다.

셀렌이 브라우저를 조작하게하는 다른 방법이 있습니까? 파일 저장은 XML 형식으로 웹 페이지를 저장하는 옵션을 제공합니다 .Selenium에서이 작업을 수행하는 방법은 무엇입니까? 여기에서 나를 도울 수있다.

편집 : 여기 내 브라우저가 인터넷 익스플로러

답변

1

는이 같은 시도 적이 있습니까? 당신이 파일 작업을 사용하여 파일에 기록 할 수 있습니다 단지 XML 컨텐츠를 제공하는 경우

String pageSource=driver.findElement(By.tagName("body")).getText(); 

pageSource 내용을 참조하십시오.

+0

해당 내용이 작동하지 않습니다. 문자열에 내용이 표시되지 않습니다. 입력에 감사드립니다. 다른 요소를 사용해 보아서 다시 시도하십시오. – Madusudanan

+0

무엇이 문제입니까? 그것이 html 페이지 인 경우 html 태그가없는 해당 페이지의 내용입니다. 여기에 URL을 게시 할 수 있습니까? – Santoshsarma

+0

무엇이 문제인지 잘 모르겠습니다. 문자열에 저장되는 내용이 없습니다. 일부 제한 사항이 있습니다. 여기에 URL을 게시 할 수 없습니다. – Madusudanan

관련 문제