나는 stackoverflow에 대한 많은 예제를 살펴 보았지만 여전히 작동하지 않습니다.웹 사이트를 크롤링하고 테이블 데이터 가져 오기
내 스포츠 클럽의 포지션 테이블을 얻기 위해 웹 사이트를 크롤링하고 싶습니다.
제 문제는 테이블에서 "tr"컨텐츠를 가져올 수 없다는 것입니다. 처음에는 REGEX를 사용했지만 사람들이 추천하지 않기 때문에 XPath를 사용하지만 작동하지 않습니다. http://resultater.dai-sport.dk/tms/Turneringer-og-resultater/Pulje-Stilling.aspx?PuljeId=104
그리고 지금 내가 가지고있는 코드는 다음과 같습니다 :
I 크롤링 할 페이지는
$doc = new DOMDocument();
$doc->loadHTMLFile("http://resultater.dai-sport.dk/tms/Turneringer-og-resultater/Pulje-Stilling.aspx?PuljeId=104"); // or you could load from a string using loadHTML();
$xpath = new DOMXpath($doc);
$elements = $xpath->query("/table/thead/tbody/tr");
print_r($elements);
내가 얻고 그 결과는 다음과 같습니다 DOMNodeList 객체 ([길이] => 0)
전 완전히 잘못 됐나요?
'thead'에서'tbody '를 찾고 계십니까? – PeeHaa
해당 페이지에 테이블이 여러 개인 경우에 대비하여 테이블 ID로도 제한하고자 할 수 있습니다. – halfer