2016-06-07 3 views
1

비슷한 자연의 일부 정보 (예 : 제품 피드)를 추출하려는 몇 개의 웹 사이트가 있습니다. 만약 내가 그 웹 사이트의 전체 DOM을 가지고 있다면, 나는 이것을 어느 정도 수행하는 알고리즘을 작성할 수있다.외부 웹 사이트에서 정보 추출

셀레늄 없이도 가능합니까? 그렇지 않은 경우, PHPUnit을 사용하지 않고 셀렌 자체를 사용하여이를 수행 할 수 있습니까?

+0

JS/AJAX로 콘텐츠를로드하지 않는 한 file_get_contents/cURL을 사용하여 마크 업을 가져온 다음 HTML 파서를 사용하여 데이터에 액세스 할 수 있습니다. –

답변

0

예를 들어 Goutte 또는 Zombie.js과 같이 사용할 수 있습니다. 많은 도구가 있습니다. PHPUnit은 필요하지 않습니다.

관련 문제