나는이 제목을페이지 키워드, 설명 및 제목을 스크랩하는 기능?
function getPageTitle ($url)
{
$content = $url;
if (eregi("<title>(.*)</title>", $content, $array)) {
$title = $array[1];
return $title;
}
}
를 스크랩하는 최초의 기능입니다 제목, 설명 및 간단한 HTML 페이지 의 키워드를 스크랩 간단한 3 개 기능을 썼다는 잘 작동하고 그 설명 및 키워드를 스크랩이 개 기능을하며,
function getPageKeywords($url)
{
$content = $url;
if (preg_match('/<meta[\s]+[^>]*?name[\s]?=[\s\"\']+keywords[\s\"\']+content[\s]?=[\s\"\']+(.*?)[\"\']+.*?>/i', $content, $array)) {
$keywords = $array[1];
return $keywords;
}
}
function getPageDesc($url)
{
$content = $url;
if (preg_match('/<meta[\s]+[^>]*?name[\s]?=[\s\"\']+description[\s\"\']+content[\s]?=[\s\"\']+(.*?)[\"\']+.*?>/i', $content, $array)) {
$desc = $array[1];
return $desc;
}
}
내가 거기는 preg_match 라인에 문제가 있습니다 만, 난 정말 내가 너무 많은 일을하려고 모르지만 그것은
작동하지 않습니다 알고 를 작동하지 않는 사람들3210
참고 : 'eregi'는 더 이상 사용되지 않습니다. http://php.net/manual/en/function.eregi.php – Will
regex를 사용하여 HTML을 파싱하면 단순한 태그 쌍보다 더 복잡한 것이됩니다. 태그 속성을 파싱하기 시작할 때 PHP Dom으로 전환해야합니다. http://php.net/manual/en/book.dom.php 이름, 설명 및 내용 속성이 있어야한다는 것입니다. 일치하는 순서. – Sp4cecat
세 번째 중요한 점은 웹 페이지에 있기 때문에 원하는 권한으로 데이터를 사용할 수 있다는 의미는 아닙니다. (허가없이. –