2013-07-26 1 views
0

클라이언트가 라이브 웹 페이지의 html 콘텐츠를 추출하여 해당 서버에서 html 페이지의 복사본을 만들고 싶습니다. 나는 곱슬 곱슬을 사용하려고 생각하고 있는데, 곱슬 곱슬을 사용하려고 할 때 어떤 성능 문제가 연결되어 있습니까? 그것은 많은 서버 메모리를 사용할 것인가?PHP 컬의 성능 관련 문제는 무엇입니까

PHP curl에 성능 문제가있는 경우이 문제를 해결하는 가장 좋은 방법은 무엇입니까?

사용자가 웹 UR1을 양식에 제출하면이 페이지를 다운로드하려고합니다. 웹 호스팅 서버는 리눅스 플랫폼에 있습니다.

미리 감사드립니다.

+0

페이지를 언제 다운로드합니까? 정기적으로? 모든 페이지로드시? –

+0

웹 URL을 양식 – madi

+1

에 제출하면 다른 웹 사이트에 대한 네트워크 연결을 기반으로 성능이 향상 될 것입니다. URL을 수천 개를로드하여 PHP 웹 사이트의 색인 생성을 위해 수천 개의 URL을로드합니다. 호스트 서버가 아닌, 서버의 색인 생성 속도가 빠릅니다. 몇 가지 옵션을 시도하고 프로젝트에 벤치 마크하십시오. – cmorrissey

답변

1

난 당신이 PHP를 사용하는 경우

wget -r 

성능을 언급하지 마십시오 (리눅스에서) 신속하고 더러운 솔루션을 대신 wget과 사용하십시오. 이러한 질문을하기 시작하려면 네트워크 프로그래밍을 고려해야합니다. 네트워크 프로그래밍을 좋아하는 사람은 사소한 주제가 아니라는 점을 경고해야합니다.

+0

PHP의 cURL 래퍼를 통해 비 크로스 플랫폼 도구를 사용 하시겠습니까? – alex

+1

크로스 플랫폼이 과대 평가되었습니다 (간단하지도 않음). 그는 창문을 사용하고 있습니까? BeOS는 어떻습니까? 기회는, 그는 이미 리눅스를 사용하고 있습니다. 그리고 그렇지 않다면, 그는 신속한 해결책을 얻기 위해 대안을 요청했습니다. Windows 용 wget 대안이 있습니까? 그는 창문에서도 실행할 수 있도록 완전 풀 웹 크롤러를 작성 하시겠습니까? – Homer6

+0

좋아, 리눅스 서버를 사용하고있다. Wget -r은 php에서 명령을 실행하는 데 사용할 수 있습니까? – madi