웹 페이지의 내용을 검색하고 해당 페이지에 모니터링 할 특정 오류 키워드가 있는지 확인하려고합니다. (매번 사이트를 확인하기 위해 각 URL을 수동으로로드하는 대신 프로그래밍 방식으로이 작업을 수행하고 오류가 발생할 경우 플래그를 지정하기 바란다)처리 된 URL 내용 확인
XMLHttpRequest를 사용해 보았습니다. 페이지에서 "소스보기"를 볼 때와 같은 HTML 컨텐트를 얻을 수 있습니다. 그러나 내가 모니터하는 페이지는 셰어 포인트에서 실행되며 웹 파트는 동적으로 생성됩니다. 오류가 발생하면이 부분을로드 할 때 오류를 포함하지는 않지만 웹 파트에 대한 일반적인 경로 만 포함하도록 HTML을 플래그 지정할 수는 없다고 생각합니다.
cURL도 같습니다. DOMDocument에 대해 읽었을 때 DOMDocument가 코드를 처리하는지 또는 HTML을 계층 적 구조로 분해하는지 궁금합니다.
URL의 콘텐츠 만 갖고 싶습니다. (HTML이 아닌 IE에서 웹 사이트를 txt로 저장할 때 얻는 것과 마찬가지). 또는 HTML을 추가로 처리 할 수 있다면 좋을 것입니다. 어떻게해야합니까? 어떤 도움이라도 대단히 감사하겠습니다. :)
당신이 웹에서 HTML 태그를 제거 만 남아있는 데이터를 얻을 싶어 명확하게하기 위해? – Nish
안녕하세요 Nish, 자바 스크립트가로드되고 콘텐츠가 생성 된 후 처리 된 콘텐츠를 가져오고 싶습니다. 자바 스크립트 및 기능이있는 뷰 소스가 아직 태그에서 제거되었습니다. 나는 자신을 더 잘 설명하기 위해 모범을보아야한다. :) – user1531773