나는 웹 사이트에 페이지가 있으며 다른 페이지에 대한 액세스 권한이 없습니다. 이 웹 사이트는 다양한 소형 제품을 판매하는 데 사용됩니다. 1 년 넘게 구글 애드 워즈를 사용하여 나 자신을 홍보하는 데 도움을 얻은 후에 제품 페이지 중 어느 것도 Google에서 색인을 생성하지 않은 것으로 나타났습니다. 사이트의 robots.txt에 많은 내용이 포함되어 있지 않으며이 파일과 관련이 있는지 궁금해졌습니다.불완전한 robots.txt, 어떻게됩니까?
제품의 URL의 형식은 다음과 같습니다
www.example.com/myshopname/[product ID]?q=I[product ID]
을 그리고 robots.txt에 간단하다 :
Disallow: /*_escaped_fragment_
에는 사용자 에이전트가 없습니다. Google이 내 페이지 크롤링에 어떤 영향을 주는지 또는 user-agent가 지정되지 않아 robots.txt를 무시하는 것인지 궁금합니다.
robots.txt 파일들이 파일에 액세스하거나 할 수없는 경우 webcrawlers 알려줍니다 웹 서버에 간단한 텍스트 파일입니다
는 여기에 몇 가지 더 자세한 정보를 얻을 수 : https://moz.com/learn/seo/robotstxt – Franco
@Franco 나는 불완전한있는 robot.txt 파일에 대한 로봇에 대한 문서, 아무것도를 참조하십시오. 내가 아는 바로는, 먼저 사용자 에이전트를 입력 한 다음 disallow 규칙을 입력해야합니다. 나는 ... 어떤 사용자 에이전트를 지정하지 않으면 어떻게되는지 확실하지 않다 사용자 에이전트는 *, 또는 사용자 에이전트가 제공되지 않기 때문에 그것을 단순히 허용 안 규칙을 무시하는 것처럼 로봇의 역할을 수행. 사용자 에이전트가 *로 작동하는 경우 규칙이 어떻게 적용됩니까? AJAX 크롤링은 이제 더 이상 사용되지 않으므로 해당 규칙을 무시합니까? – Alex