2014-04-11 1 views
0

기본적으로 CMS (EasySite) (3000 페이지 이상)에 내장 된 웹 사이트의 일부입니다. 특정 태그 (예 : style="font-size:10px")의 각 페이지에서 HTML을 스캔하는 도구 나 다른 방법이 있는지 궁금합니다.특정 HTML 태그에 대한 웹 사이트 스캐너?

많은 사람들이 분명히 서식을 복사하는 MS Word의 콘텐츠를 복사하여 붙여 넣습니다. 데스크톱 사이트에는 표시되지 않지만 모바일/태블릿 기기에 표시됩니다. 현재의 모든 페이지에서이 정렬이 필요합니다.

+0

페이지를 저장하는 데이터베이스가 있습니까? 그것에 대해 질의 할 수 있습니까? – eXplicit

+0

CMS를 사용하면 콘텐츠가 데이터베이스에있을 가능성이 높으므로 문제가 될 수 있습니다. 그것을 고치면 (= 그 태그를 벗겨 내기) 엔딩 태그 때문에 꽤 복잡해질 수 있습니다. 데이터베이스에 없으면 파일에 대한 텍스트 검색이 트릭을 수행해야하며, 문제가 해결 될 때와 동일한 문제가 있습니다. –

+0

나는 약 2500 페이지와 비슷한 상황에있다. 우리는 siteimprove라는 서비스를 유료 서비스로 사용하지만 웹 거버넌스에서는 꽤 잘 작동합니다. 비슷한 제품이 있다는 것을 알고 있습니다. – DD0UG

답변

0

다음 작업을 수행 할 것입니다 : 당신의 로컬 파일 시스템에

  1. 미러 사이트를 가장 같은 도구를 검색을 수행하기 위해 다운로드 한 파일에
  2. 일 (wget --mirror http://example.com와 예를 들어, manpage of wget 참조) (파이썬 또는 grep - 예 : grep -rn 'style="font-size:10px"' mirror_directory)
관련 문제