2012-12-12 2 views
1

오프라인 사용을 위해 온라인 힌디어 사전을 다운로드해야합니다. 사전에있는 모든 단어는 PHP로 생성 된 페이지가 있습니다. 이 페이지의 URL은 http://pustak.org/home.php?mean=X입니다. 여기서 X는 숫자입니다.PHP로 생성 된 웹 페이지를 프로그래밍 방식으로 다운로드하십시오.

따라서 사전의 첫 번째 단어는 http://pustak.org/home.php?mean=1으로 이동하고 두 번째 단어는 http://pustak.org/home.php?mean=2 등으로 이동합니다.

프로그래밍 방식으로 이러한 페이지를 모두 다운로드하여 별도의 html 파일로 저장하려면 어떻게합니까?

추 신 : 궁금한 점이 있으시면 여행 중에 iPod touch에서 오프라인으로 참조하려면 힌디어 사전이 필요합니다 (Touch에는 셀룰러 데이터가 없기 때문에). 나는 힌디어 사전 응용 프로그램의 전체 무리를 시도하고 그들 중 누구도이 무료 온라인 사전의 품질과 정의 - 계산에 가깝지 않습니다. 그래서 내 계획은 HTML 파일로 모든 것을 다운로드하고 전체 텍스트 검색을 지원하는 iOS 파일 시스템 응용 프로그램에 모든 파일을 저장하며 나 자신의 오프라인 사전을 가지고 있습니다 ...

도움말 감사합니다.

+0

cURL 및'file_put_contents'는 (는) 친구가됩니다. – moonwave99

+0

평균의 최대 값은 얼마입니까? – Dale

+0

아니면 외부 도구를 사용할 수 있습니다. 예를 들어 http://www.httrack.com처럼. – sprain

답변

0

당신은 file_get_contents 그것을 시도 할 수 있습니다 :

$max = 100000 //total num of words to get 

for($cont=1; $cont<$max; $cont++){ 
    $sourceCode = file_get_contents('http://pustak.org/home.php?mean=$cont'); 

    if(!file_put_contents('/path/word'.$cont.'.html',$sourceCode)){ 
     echo "error with word number".$cont; 
     die(); 
    } 
} 
1

약간 다른 접근 방법, 나는 개인적으로 홈페이지에서 HTTrack

을 사용합니다 :

가 HTTrack는 무료 (GPL, 리브레/무료 소프트웨어) 및 사용하기 쉬운 오프라인 브라우저 유틸리티.

인터넷에서 로컬 디렉토리로 다운로드하여 재귀 적으로 모든 디렉토리를 만들고 HTML, 이미지 및 기타 파일을 서버에서 컴퓨터로 가져올 수 있습니다. HTTrack 은 원본 사이트의 상대 링크 구조를 정렬합니다. 브라우저에 "미러링 된"웹 사이트의 페이지를 열고 온라인에서 보는 것처럼 링크 링크를 찾아 볼 수 있습니다. HTTrack은 도 기존의 미러 사이트를 업데이트하고 중단 된 상태로 다시 시작할 수 있습니다. 다운로드. HTTrack은 완전히 구성 가능하며 통합 도움말 시스템을 가지고 있습니다.

웹 사이트에 따르면 Windows 2000/XP/Vista/Seven 및 여러 가지 Linux 버전을 지원합니다.

당신이 언급 한 iOS 앱에 다운로드 한 파일을 가져올 수 있다고 가정합니다.

관련 문제