2010-06-25 1 views
2

웹 사이트 용 사이트 맵을 생성하는 기능 세트를 작성 중입니다. 웹 사이트는 블로그라고 가정합니다.동적 웹 사이트에 대한 사이트 맵 파일 및 해당 내용에 대한 질문

사이트 맵의 정의는 웹 사이트에서 사용할 수있는 페이지를 나열한다는 것입니다. 동적 웹 사이트의 경우 해당 페이지가 상당히 정기적으로 변경됩니다.

사이트 맵의 링크 수에 제한이 있기 때문에 블로그 예제를 사용하면 블로그 게시물이됩니다 (지금 생각해 보면 사이트 맵 인덱스는 제외). 미래의 어떤 시점에서 한도를 초과하기 때문에 최신 블로그 글 목록을 계속 추가 할 수 없다는 것을 의미합니다.

위의 단락에서 2 가지 (매우 기본적인) 가정을했습니다. 그들은 :

가정 1 :

이 사이트 맵은 웹 사이트의 페이지 목록이 포함되어 있습니다. 블로그와 같은 동적 웹 사이트의 경우 해당 페이지는 블로그 게시물이됩니다. 따라서 웹 사이트의 블로그 포스트를 나열하는 사이트 맵을 만들 수 있습니다. (이것은 나에게 피드 같은 소리)

가정 2 :

사이트 맵 파일에 링크의 수에 엄격한 제한이 있기 때문에, 좀 인해 임의 제한 N을 부과하고, 간단하게 생성 할 수 있습니다 최신 N의 블로그 게시물을 나열, 주기적으로 파일

다음

내 질문이 있습니다 (이 단계에서,이 피드에서 구별) :

  • 는 가정 (즉 사이트 맵 파일 내부에서 어떤 일이 일어나는지에 대한 이해) VA 뚜껑/맞지?
  • 위에서 설명한 내용은 피드와 매우 흡사합니다. 단순히 봇이 피드를 사용하여 웹 사이트를 인덱싱하지 않을 수 있습니다 (즉, 필요한 사이트 맵)?
  • 내가 최근에 변경된 파일을 생성 중이라면 사이트 맵 프로토콜 파일에 추가 할 점이 없습니다. 누군가 설명 할 수 있습니까?

답변

1

가정용 1은 정확합니다. 사이트 맵은 실제로 사이트의 페이지 목록이어야합니다. 귀하의 경우에는 블로그 게시물이되고 예는 연락 페이지, 홈 페이지, 약 페이지 등.

예, 피드와 조금 비슷하지만 피드에는 일반적으로 최신 항목 만 있지만 사이트 맵에는 모든 것이 있어야합니다.

  • 사이트에 동적 콘텐츠가 다음의 경우 Google's docs:

    사이트 맵에서

    특히 도움이됩니다.

  • 귀하의 사이트에는 크롤링 과정에서 Googlebot이 쉽게 발견 할 수없는 페이지가 있습니다 (예 : 풍부한 AJAX 또는 이미지가 포함 된 페이지).
  • 귀하의 사이트는 새로운 것이며 관련 사이트가 거의 없습니다. Googlebot은 한 페이지에서 다른 페이지로 연결되는 링크를 따라 웹을 크롤링하므로 사이트가 잘 연결되어 있지 않으면 발견하기 어려울 수 있습니다.)
  • 사이트에는 서로 잘 연결되지 않았거나 전혀 연결되지 않은 콘텐츠 페이지의 대용량 아카이브가 있습니다.

가정이 조금 잘못 - 사이트 맵 파일에 대한 제한은 당신이 다음, 그 한계를 히트 맵 색인 파일을 생성하여 시작할 가능성이 생각하는 경우, 50,000 링크/10메가바이트이 ​​압축되지 않은 만 하나의 사이트 맵에 링크 한 다음 이동하면서 추가하십시오.

Google은 사이트 맵으로 모든 RSS 피드를 허용하지만 일반적으로 최신 링크 만 포함한다는 점을 지적합니다. 사이트 맵을 사용하면 사이트의 모든 것을 커버해야한다는 점이 중요합니다. 가장 최근에 발견 된 항목 일 가능성이 가장 높습니다.

관련 문제