2011-04-09 6 views
2

PHP를 통해 페이지 콘텐츠를 얻으려면 어떻게해야합니까? 대부분의 RRS 피드는 기사에 대한 링크 만 제공하므로 블로그 게시물의 텍스트를 어떻게 잡을 수 있습니까? 이 작업을 수행하는 PHP 함수가 있습니까? 제발 몇 가지 제안을 제공하십시오 :).PHP를 통해 웹 사이트 내용 가져 오기

+0

Google을 사용해 보셨습니까? –

+0

콘텐츠를 가져 오려는 URL이 있으면이 우수한 스레드를 통해 읽으십시오. http://stackoverflow.com/questions/3650125/how-to-parse-html-with-php - 내가 찾을 수없는 HTML 구문 분석 옵션에 대한 링크가있는 질문. – Daniel

+0

Daniel의 제안은 훌륭합니다. 아래에서 제 답변에서 궁극적 인 목표를 달성하는 데 도움이되는 (또는 필요한!) 멋진 HTML 파서/화면 라이브러리에 대한 링크를 게시했습니다. – Eric

답변

8

그냥 페이지, HTML을로드하려면 모든, 당신은 웹 주소를 fopen을 사용할 수 있습니다 (

$page = file_get_contents('http://www.blog.com/one-example-post'); 

웹 페이지의 고급 처리의 경우, 컬 라이브러리가 원격 서버와 더 영리하게 상호 작용 예를 들어 HTTP 인증이 있거나 https 페이지 인 경우).

일단 페이지 내용이 있으면 screen scraping (일명 웹 스크래핑)을해야 할 것입니다. 다른 프로젝트에서이 작업을 수행 한 이후로 운이 좋았습니다. Here's a great library 나는이 다운 앤드 더러운 기술을 돕기 위해 폭로했다. 행운을 빕니다.

관련 문제