2010-07-14 4 views
2

2 개의 html 페이지의 차이점을 확인해야합니다. 하나는 이전 버전이고 다른 하나는 업데이트 된 페이지입니다.Java 및 셀렌을 사용하여 2 개의 html 문서를 비교해야합니다.

두 페이지의 소스를 가져 와서 비교하여 차이점을 확인하려면 Selenium이 필요합니다.

Java를 사용하여 이것을 수행하려면 어떻게해야합니까? & Selenium? 표준 형식으로 데이터를 변환 이전 웹 페이지

  • 에 대한 모든 데이터를 수집 셀레늄
  • (아마 XML)를 사용하여 이전 페이지

    • 이동 : 아래

      는 내가 가지고있는 흐름입니다 ; (파일 표준 포맷으로 데이터를 변환 새로운 웹 페이지
    • 에 대한 모든 데이터를 수집 셀레늄
    • 를 사용하여 새 페이지
    • 이동이
    • 저장을 데이터를 수행하는 XML을 클래스 를 만들 아마); 당신이 파일
    • 저장을 데이터 작업을 수행하기 위해 만든 클래스를 사용하는 두 개의 파일
    • 을 diff를 위해 자바 라이브러리를 사용

    사람이를 구현하는 방법에 아이디어/예제를 줄 수 있습니까?

  • +0

    이것을 구현할 수 있었습니까? 가능한 경우 솔루션을 공유하십시오. –

    답변

    2

    각 페이지마다 selenium.getHtmlSource()를 사용하고 반환 된 String을 Java로 비교하거나 파일에 저장하고 "diff"와 같은 명령 줄 도구를 사용하십시오.

    자바를 사용한다면, 내가 생각할 수있는 두 가지 방법은 StringUtils.difference() (거의 확실하게 엉망) 또는 더 나은 아직 Google Diff과 같은 것을 사용하고 있다고 생각할 수 있습니다. Google diff에는 Java 라이브러리와 테스트 예가 있습니다.

    물론 출력 결과가 리터럴 diff 일 것이므로 HTML에서 변경 사항을 이해하는 데 더 많은 맞춤 설정이 필요할 수 있습니다.

    관련 문제