하나의 웹 사이트에서 기사 및 기타 콘텐츠를 검색하고 싶습니다. 크롤러에 대한 아이디어를 얻었고 먼 페이지를 열어서 정규식에 따라 텍스트 부분을 얻을 수 있다고 가정합니다. 궁금한 점은 단일 페이지 (또는 페이지 매김)뿐만 아니라 전체 웹 사이트에서 각 요소에 대한 크롤러를 하나씩 실행하고 프로세스의 기존 URL을 잊지 않고 검색 할 수 있다는 것입니다.전체 웹 사이트의 PHP 크롤러
일회성이므로 이걸 깨끗하게 처리 할 필요가 없습니다. 웹 에이전시와 계약을 맺고 나 자신의 데이터베이스 덤프에 대해 엄청난 돈을 청구하려고합니다. 따라서 빠른 대안을 찾아야합니다. 나를 시작할 수 있도록 나를 걸을 수 있습니까?
감사합니다.
많은 양의 데이터가 필요하지 않으며 100 % 확실성으로 전체 데이터가 필요합니다. – Baylock
불행히도 100 % 확실성을 가진 모든 페이지를 얻는 방법은 없습니다. 찾을 수없는 파일에 대한 참조가 없습니다 - 특히 자동으로! – Chris
예를 들어 javascript가 추가되었습니다. –