2014-05-19 3 views
-1

내 고용주 웹 사이트를 복사하는 방법에 대한 아이디어를 얻기 위해 여기에 게시하고 있습니다.내 도메인에서 다른 웹 사이트 콘텐츠를 즉석에서 제공하는 방법은 무엇입니까?

기본적으로 내 고용주 웹 사이트는 here이며 오늘은 웹 사이트에 공개적으로 액세스 할 수있는 모든 페이지를 복사 한 here이라는 관련없는 다른 웹 사이트가 있음을 발견했습니다.

이제 캐치가 나타납니다. 사이트를 spidered했으며 현재 서버에서 HTML 복사본을 제공하고있는 것 같지 않습니다. 대신, 해당 사이트에서 페이지를 요청할 때마다 웹 사이트에 라이브 쿼리를 보내 해당 콘텐츠를 제공합니다. 또한 이메일 및 도메인과 같은 항목을 이메일의 도메인으로 대체합니다.

제 질문은, 코드 관점에서 우리에게이 일을하는 사람이 어떻게 할 수 있습니까?

이것이 가능하다는 것을 알고 싶습니다. 또한 이해하고 더 중요하게는 멈추고 더 이상 일어날 수 없도록 예방할 수 있습니다.

이것이 스택 오버 플로우 유형 질문이 아닌 경우 미리 사과하십시오, 나는 그것이라고 생각합니다. 그렇지 않다면 다른 스택 교환 사이트로 옮길 수 있습니다.

+0

프록시. 합법적 인 이유가 필요한 경우 "XXXX [당신이 선호하는 언어]에서 웹 서비스 호출을 프록시하는 방법"을 검색하면 세부 사항에 대한 많은 답변을 얻을 수 있습니다. –

+2

아마도이 웹 사이트는 프로 웹 마스터 사이트에 속해 있습니까? http://webmasters.stackexchange.com – JakeGould

+1

매우 간단합니다. 그들은 단지 서버에 요청합니다. 내용을 가져옵니다. 교체 한 다음 사용자에게 반환하십시오. 나는 그 (것)들을 접촉하고 그 (것)들에게 멈출 것을 시작할 것입니다. 그리고 그들이 요청한 IP를 파악하지 못하면 요청을 차단 한 다음 차단하거나 다른 서비스를 제공 할 수 있습니다. – WizKid

답변

3

제 질문은 코드 관점에서이 작업을 수행하는 사람이 어떻게 할 수 있습니까?

쉬운. 그들은 어떻게 든 귀하의 사이트 구조를 크롤링하고, 콘텐츠를 변경하기 위해 찢어서 & 도메인으로 재구성합니다. 이를 수행하는 방법에 대한 재미있는 예를 보려면 Meowbify을 확인하십시오.

그렇다면 서버의 액세스 로그를 확인하면 IP 주소를 통해 차단할 수 있습니다. 그렇게 로그를 꼬리 만하십시오. 난 당신이 아파치를 실행하는 리눅스 설치에있는 가정입니다 : 그와 지금

tail -f -n 200 /var/log/apache/access.log 

을 장소에,이 불량 사이트의 페이지로 이동이 IP 주소가 팝업을 확인 & 클릭합니다. 이 예를 들어, 123.456.789.0이라고합시다. 알았어? 글쎄, 당신은 An .htaccess 파일에 다음과 같은 작업을 수행 할 수 아파치를 사용 :

order allow,deny 
deny from 123.456.789.0 
allow from all 

이 효과적으로 IP 주소 123.456.789.0의 모든 웹 서버에 대한 액세스를 차단합니다.

또는 완전히 그래서 같은 네트워크 액세스 차단 iptables을 사용할 수 말했다

sudo iptables -A INPUT -s 123.456.789.0 -j DROP 

,이 게임처럼 될 수 있습니다

iptables -A INPUT -s 123.456.789.0 -j DROP 

당신은 sudo 그래서 같은 것을 실행해야 할 수도 있습니다를 Whack-A-Mole. 그래서 당신은 다른 전략을 생각해 낼 수 있습니다. 예를 들어 사이트가 PHP로 코딩되어 있습니까? 선반 시스템에서 벗어나거나 맞춤형으로 제작 되었습니까? 시스템 레벨에서 iptables으로하거나 아파치와 같은 웹 서비스 레벨에서 수행하는 대신 PHP 기반의 액세스 제어 방법을 생각해 볼 수 있습니다.

또는 심지어 교활 할 수도 있습니다.IP 주소를 통해 액세스 할 때 다른 사이트에 횡설수설 한 콘텐츠를 보내도록 사이트를 코딩하는 경우. Lorem ipsum dolor sit amet, consectetur adipiscing elit. 단지 더미처럼 원치 않는 사이트로 전송되는 정크는 사용자가 감지 할 때 거기에 있습니다.

그러나이 모든 것이 궁극적으로 인터넷에서 궁극적으로 이렇게 긁힐 수 있습니다. 모든 사이트는 긁어 모아서 & 콘텐츠에 재사용 될 수 있습니다. 사회적으로 잘못 되었기 때문에 그렇게되지는 않습니다. & 자신의 저작물을 만든 후에도 저작권이 유지 될 수 있기 때문에 지속 불가능합니다.

그래서 저작권 측면을 알고 핵 옵션은 웹 사이트 호스트에게 연락하여 저작권 침해 주장을하는 것입니다. 그들은 당신의 일을 벗기는 서비스를 끊을 것입니다. 그러나 그렇게하는 것이 결코 쉬운 일은 아닙니다. ISP가 협조적인지 여부는 알 수 없습니다.

관련 문제