2010-06-22 2 views
3

에 의해 크롤링 될 수 있습니다. JavaScript를 통해 페이지에 콘텐츠를 추가하는 경우 검색 엔진 스파이더가 크롤링 할 수 있고 스크린 리더가 액세스 할 수 있습니다. example thisJavaScript를 통해 페이지에 콘텐츠를 추가하는 경우 검색 엔진 스파이더

var tip = "<p>Most computers will open PDF documents "; 
tip += "automatically, but you may"; 
tip += "need to download <a title='Link to Adobe website-opens in a new window'"; 
tip +=" href='http://www.adobe.com/products/acrobat/readstep2.html' 
       target='_blank'>Adobe Reader</a>.</p>"; 

$(document).ready(function(){ 

    //IF NUMBER OF PDF LINKS IS MORE THAN ZERO INSIDE DIV WITH ID maincontent 
    //THEN THIS WILL PUT TIP PARAGRAPH AS LAST CHILD OF DIV 
    if($("div#maincontent a[href*='/pdf']").length>0){ 
    $("div#maincontent").children(":last-child").after(tip); 
    } 
}); 

편집을 위해

: 나는 그것을 가능 화면 판독기에 액세스 계속 검색 엔진에서 그러나 동시에이 문제를 숨기려?

답변

2

크롤러에 따라 다르지만 대부분의 봇이 Javascript를 해석하지는 않습니다.

2

짧은 답변, 아마도 그렇지 않습니다. 그러나 Google은 항상 정교 해지고 있습니다. 따라서 색인 생성 프로세스의 일부로 실제로 자바 스크립트를 렌더링한다는 의혹이 있습니다.

이렇게하는 특별한 이유가 있습니까? 가능하다면이 로직 서버 측을 수행하는 것이 좋을 것입니다. 그러면 HTML이 검색 엔진에서 읽을 수 있음을 알 수 있습니다.

+0

그러나이 생성 된 코드는 렌더링 된 코드 소스와 방화 광물에도 표시됩니다. –

+0

예, 브라우저에서 완전히 렌더링 된 후 Firebug가 코드 DOM을 표시합니다. Google이 색인 생성 프로세스의 일부로이를 수행하는지 여부는 알 수 없습니다. 가능한 경우 서버에서 HTML을 보내십시오. 예를 들어 HTML의 특정 비트가 검색 엔진에서 흥미롭지는 않으므로 큰 문제는 아닙니다. 그러나 실제 콘텐츠가 있다면 위의 작업을 수행 할 것입니다. –

+0

Google은 일반적으로 자바 스크립트를 실행하지 않습니다 (일부 휴리스틱을 사용하여 상황을 파악할 수는 있지만). 이 특별한 경우에는 자바 스크립트의 문자열에 삽입 된 HTML을보고 어쨌든 색인을 생성합니다. 개인적으로, 나는이 대답에 동의한다. 자바 스크립트를 사용하는 사람들에게는 아무런 도움이되지 않는다는 점을 제외하고는 자바 스크립트를 사용하면 이점이 없다. (단점은 물론) ... –

1

Re : 브라우저에서 동적으로 생성 된 콘텐츠가 검색 엔진에서 크롤링 할 수 있습니까?

일반적으로 없습니다.

하지만 Google은 문제를 해결할 방법을 고안했습니다. ajax crawling

참고 : 동적 페이지의 여러 상태를 나타내는 다양한 쿼리 매개 변수를 사용하여 URL을 크롤링하면됩니다. 그들은 당신의 페이지에서 js를 실행하려고 시도하지 않습니다.

0

아니요, 대부분의 웹 크롤러는 JavaScript를 실행하지 않으며 오래된 화면 판독기도이를 읽지 않습니다. 최선의 방법은 프리젠 테이션 목적으로 만 자바 스크립트를 사용하고, 로직 서버 측 (PHP, Ruby, .NET 등)과 CSS 매직을 사용하여 위에서 설명한 내용을 달성하는 것입니다. 웹 크롤러 및 화면 판독기가 염려되는 경우 항상 서버 측에서 콘텐츠를 삽입하고 프레젠테이션에만 자바 스크립트를 사용하십시오. 또는 화면 판독기에 플래시 및 자바 스크립트 스니퍼를 사용하여 동적 콘텐츠에 의존하지 않는 대체 페이지로 사용자를 리디렉션 할 수 있습니다.

관련 문제