2012-04-02 4 views
0

phpcrawler의 최신 버전을 다운로드했으며 직접 테스트 웹 사이트에 액세스 할 수 있습니다.PHPcrawler - tmp 파일

난 단지 이미지를이 사이트에 대한 몇 가지 텍스트가

, 나는 크롤러를 실행하고 내가했기 때문에 나는 텍스트 마이너스 이미지를받을 적절한 나는 TMP 파일을 저장하기 위해 그것을 얻을 수 없습니다 $crawler->addNonFollowMatch("/.(jpg|gif|png)$/ i");

유일한 tmp 파일을 크롤러를 실행하는 폴더에 저장하지 않고 이름이 지정된 파일을 저장하려고했습니다.

예를 들어, @fopen과 같이 많은 다른 감가 상각 된 오류가 모든 PHP 파일에서 실행되었습니다. @은 다른 영역의 문제를 일으 킵니다. 나는 PHP을 사용하고 Regex도 할 수 있습니다. 데이비드.

답변

0

저는 PHPCrawler 개의 질문에 답을 얻지 못했기 때문에 제 자신의 질문에 대답했습니다. 작년에 한 질문에 답이 없습니다. 나는 또한 어떤 좋은 일을하기에는 너무 늦을 지 모르지만 그것을 또한 대답 할 것이다. 이것이 답입니다.

나는 내 요구에 따라 조정 수정 phpcrawler에 추가 :

$fp = fopen('c:/test/poopoo.txt','w'); 
fwrite($fp,($page_data['source'])); 
fclose($fp); 

파일을 세척하기 전에 넣고 클래스의 인스턴스를 만들 수 있습니다.

PHP Simple HTML DOM Parser을 사용하여 발견되었습니다. this project에서 잘 작동합니다. 더 많은 제어가 필요하다면 RegExp을 사용하십시오. 그러나 가파른 학습 곡선이 있습니다.

+0

수정 사항에 대한 축하와 함께 PHPCrawler 하위 커뮤니티를 찾아 주셔서 감사합니다! 할 수있을 때 다른 사람들이 당신의 성공을 통해 배울 수 있도록 귀하의 대답을 '수락'으로 표시하십시오. 건배 ~ –

관련 문제