2010-04-07 6 views
30

Google을 사용하여 주변을 검색했지만이 질문에 대한 답변을 찾을 수 없습니다.여러 Sitemap : robots.txt의 항목?

robots.txt 파일에 다음 행이 포함될 수 있습니다

Sitemap: http://www.mysite.com/sitemapindex.xml 

을하지만 robots.txt에 여러 사이트 맵 색인 파일을 지정하고 검색 엔진이 인식해야하고, 사이트 맵의 전체를 크롤링 할 수 있습니다 각 사이트 맵 색인 파일에서 참조 되나요? 예를 들어 다음과 같이 작동합니다.

Sitemap: http://www.mysite.com/sitemapindex1.xml 

Sitemap: http://www.mysite.com/sitemapindex2.xml 

Sitemap: http://www.mysite.com/sitemapindex3.xml 
+0

는 것입니다 예, 참조 : http://ligatures.net/content /expertise/robots-txt-implementation.html – JVerstry

답변

-1

쓰기는 가능하지만 처리 방법은 검색 엔진이 결정합니다. 많은 검색 엔진이 점점 더 많은 토큰을 소화 시키거나 양자 택일로 실제 사이트의 마지막 사이트 맵을 얻게 될 것으로 생각합니다.

"____ 검색 엔진에서 내 사이트의 색인을 생성하려면 여러 사이트 맵을 정의 할 수 있습니까?"라는 질문을 제안합니다.

+1

그래,이게 합리적인 것처럼 보입니다. 나는 Google FAQ에서 그들이 이것을지지한다고 생각합니다. – user306942

+0

Google은이를 지원하지만 확신하고 싶다면 웹 마스터 도구에서 Sitemap 파일을 수동으로 제출하십시오. –

+0

-1 프로토콜 사양입니다. 이 대답은 여기에 그것을 읽지 않고 다른 모든 사람들, 특히 구현 자들도이 책을 읽지 않을 것이라고 가정 할 때 불쌍한 변명입니다. robots.txt에서 사이트 맵을 전혀 지원하지 않을 확률이 훨씬 높으며 사양에 따라 지원하지 않습니다. – hakre

63

네, more than one sitemap-index-file을 가질 수 있습니다 :

당신은 하나 개 Sitemap 색인 파일보다 이상을 가질 수 있습니다.

하이라이트.

당신은의 robots.txt 파일 당 하나 개의 사이트 맵 파일보다 이상을 지정할 수 있습니다

네,뿐만 아니라 in the sitemap.org site 참조 robots.txt 내에서 여러 사이트 맵 - 파일을 나열 할 수 있습니다. 내게로

Sitemap: http://www.example.com/sitemap-host1.xml 

Sitemap: http://www.example.com/sitemap-host2.xml 

강조,이 때문에 단순히 말,이 작업을 수행 할 수 있습니다, 내가 말하고 싶지만 오해 할 수 없습니다.

btw 인 교차 제출에도 필요합니다. robots.txt이 선택되었습니다.

Btw는 구글, 야후, 모든 members of sitemaps.org 다음과 같습니다

사이트 맵 0.90은 저작자 표시 - 동일 조건 변경 허락 크리에이티브 커먼즈 라이센스의 조건에 따라 제공되며 가지고있다 구글, 야후! 및 마이크로 소프트의 지원을 포함하여 광범위한 채택.

따라서 사이트 맵 항목이 검색 엔진 로봇에 의해 올바르게 읽혀질 수 있습니다.

웹 마스터 도구를 통해 제출하면 존 뮬러commented과 같이 웹 마스터 도구를 통해 제출할 수 없습니다.

+1

Google robots.txt 문서는 Google에서이 사실을 확인하고 다른 로봇에서도 사용할 수 있다는 내용을 확인합니다 : "여러 사이트 맵 항목이있을 수 있습니다. 그룹 회원이 아닌 레코드는 특정 사용자와 관련이 없습니다 모든 크롤러가 따라갈 수 있습니다. 단, 허용되지 않는 한. " Google robots.txt 문서는 다음에서 찾을 수 있습니다. https://developers.google.com/webmasters/control-crawl-index/docs/robots_txt –

+1

robots.txt에 여러 sitemap * index * 항목이 있는지 질문합니다 '여러 사이트 맵 엔트리가 존재하지 않을 수도 있습니다. –

+1

@NigelAlderton : 사양도 이와 비슷합니다. [* "둘 이상의 Sitemap 색인 파일을 가질 수 있습니다."* (http://www.sitemaps.org/protocol.html#index). * Sitemaps & Cross Submits * 섹션과 비교하면 도메인 간 색인 사용을 위해 'robots.txt'당 여러 개의 색인 파일을 허용하는 것이 분명하지만 필수적입니다. – hakre

6

Sitemap이 10MB (압축되지 않음) 이상이거나 50,000 개가 넘는 항목이있는 경우 Sitemap 색인 파일과 함께 번들로 제공된 여러 사이트 맵을 사용해야합니다.

:

<?xml version="1.0" encoding="UTF-8"?> 
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> 
    <sitemap> 
     <loc>http://www.example.com/sitemap1.xml.gz</loc> 
     <lastmod>2012-10-01T18:23:17+00:00</lastmod> 
    </sitemap> 
    <sitemap> 
     <loc>http://www.example.com/sitemap2.xml.gz</loc> 
     <lastmod>2012-01-01</lastmod> 
    </sitemap> 
</sitemapindex> 
+2

음, 정확히는 아닙니다. http://www.sitemaps.org/protocol.php에서 : "각 텍스트 파일은 최대 50,000 개의 URL을 포함 할 수 있으며 10MB (10,485,760 바이트) 이하 여야합니다." – ayke

+1

Google이 이후 Sitemap 파일 당 허용되는 크기를 50MB 으로 올렸습니다. http://stackoverflow.com/questions/2887358/limitation-for-google-sitemap-xml-file-size –

+2

사이트 맵보다 더 좋을까요? sitemapindex.xml 또는 각 sitemap : lines을 가리키는 여러 줄이 있습니까? – WarrenDodsworth