나는 심각한 질문이 있습니다. 웹 사이트에서 robots.txt 파일의 존재를 무시하는 것이 윤리적입니까? 이 내가 마음에있어 몇 가지 고려 사항은 다음과 같습니다robots.txt 윤리
누군가가 그들이 어떤 방문을 기대하고 웹 사이트를 박았합니다. 물론, 웹 크롤러는 사이트를 지원할 수있는 광고를 클릭하지 않고 대역폭을 사용하고 있지만 사이트 소유자는 자신의 사이트를 웹에 올려 놓고 있습니다. 그렇다면 결코 봇이 방문하지 않을 것으로 예상하는 것이 얼마나 합리적입니까?
일부 사이트는 robots.txt를 사용하여 Google이나 가격을 확보 할 수있는 다른 유틸리티에 의해 사이트가 크롤링되지 않도록하기 때문에 분명히 가격 비교를 할 수 있습니다. 사이트에 사설 검색 엔진이있어 사람들이 사이트를 검색 할 수있게하려는 것입니다. 분명히 사람들은 다른 공급 업체와 정보를 쉽게 비교할 수 없기를 바랄뿐입니다.
내가 말했듯이 나는 논쟁의 여지가 없다. Robots.txt 파일의 존재를 무시하는 것이 윤리적으로 허용되는 경우를 생각해 본 사람이 있는지 알고 싶습니다. 사람들 (또는 기업)이 자신의 웹 사이트를 올리기 위해 돈을 지불하고 있기 때문에 주로 로봇을 무시하는 것이 허용 될 수 없다고 생각할 수는 없습니다. 그래야 Google 직원이 세계의 Google/Yahoos/Other SE에게 말할 수 있어야합니다. 그들의 색인에 있고 싶지 않다.
이 토론을 배경으로하면 가격 비교 웹 사이트를 만들고 싶습니다. 주요 공급 업체 중 하나에는 기본적으로 누구나 가격을 책정하지 못하도록하는 robots.txt가 있습니다. 나는 그들의 정보를 얻을 수 있기를 원하지만, 내가 말했듯이, 나는 단순히 사이트 소유자의 희망을 무시하는 것을 정당화 할 수 없다.
저는 여기서 매우 날카로운 토론을 보았습니다. 그래서 저는 Stack Overflow를 따르는 개발자들의 의견을 듣고 싶습니다.
그런데이 주제에 대한 논의는 Hacker News question에 있습니다.하지만 주로이 문제의 법적 측면에 초점을 맞추는 것처럼 보입니다.
@Andrei : 제가 투표를했기 때문에 그것이 었습니다. 당신이 "나쁜 매너를 나타내는 질문"또는 "나쁜 매너를 나타내는 질문"을 유효한 것으로 포함시키지 않는 한 그것은 유효한 질문이 아닙니다. –
@ John Saunders - Robots.txt를 무시하는 것이 괜찮을지는 상상할 수 없습니다. 그러나, 내가 고려하지 않은 상황이있을 수 있음을 알고 있습니다. 나는 열린 마음을 유지하려고 정말로 노력하고 있습니다. –
@Onorio : 그렇다면 좋은 이유를 들어 봅시다. 좋은 이유가 없다면 나는 아무 것도 없다고 가정하고있다. –