2012-11-22 9 views
0

데이터를 생성하는 데 CURL을 사용하고 있습니다. 사이트가 추출을위한 다른 형식을 제공하지는 않지만 그럼에도 불구하고 내가 한 것은 HTML에서 데이터를 검색하고 검색하는 것입니다. 이것은 내 스크립트가 검색하는 것입니다. HTML 데이터를 JSON 또는 XML과 같은 다른 형식으로 변환하여 PHP에서 HTML을 쉽게 파싱 할 수 있습니까? JSON/XL에서 데이터를 가져올 수없는 경우 관련성에 따라 데이터를 구문 분석하는 방법은 무엇입니까? json에서 가져올 코드가 있습니다.HTML 데이터를 파싱하는 CURL

function get_json_content($json_url = '') { 
    $ch = curl_init($json_url); 
    $options = array(
     CURLOPT_RETURNTRANSFER => true, 
     CURLOPT_HTTPHEADER => array('Content-type: application/json'), 
     CURLOPT_TIMEOUT => 160, 
     CURLOPT_FOLLOWLOCATION => 1 
    ); 

    curl_setopt_array($ch, $options);    // Setting curl options 
    $result = curl_exec($ch);      // Getting jSON result string 
    return $result; 
} 

$json_url = 'http://www.evertek.com/viewpart.asp?auto=78053&cat=45#.UKZWHme5JI4'; 
$get_result = get_json_content($json_url); 
die($get_result); 

$get_result은 html로 수신합니다. 저의 좌우명이 어떤 형식이든 관계없이 적절한 형식으로 데이터를 추출하거나 파싱하는 것입니다. PHP로 사용할 수 있도록 데이터를 쉽게 파싱하고 싶습니다.

답변

0

CURL이 제공하는 것만 사용할 수 있으며 CURL은 주어진 내용 (예 : HTML) 만 가져올 수 있습니다. 쉬운 일이 아니다 전체 웹 사이트에서 데이터를 검색하려고 How do you parse and process HTML/XML in PHP?

+1

감사합니다. SimpleHtmlDom 파서를 사용해 주셔서 감사합니다. – Sankalp

0

:

HTML은 작동 여기에 대한 답변을 살펴보고 어려운 일이 아니다. 웹 사이트에서 지원하는 API를 사용하면 조작하기 쉬운 의미있는 방식으로 데이터를 제공 할 수 있습니다.

웹 사이트 스크래핑 관련 튜토리얼을 검토해야합니다. 그렇지 않으면 HTML을 구문 분석하고 쓸데없는 정보를 제거해야합니다.

관련 문제