그래서 로컬 컴퓨터에서 완벽하게 실행되는 nokogiri 웹 스크래핑을 사용합니다.레일 URL 링크가있는 프록시 사용
그러나 제작 환경에서 웹 스크래핑을 실행하면 403 오류 코드가 표시됩니다.
나는 이것이 내 서버 내 IP를 차단하는 웹 사이트에 다운 생각
이 경로에 프록시 서버를 통해 내 웹 서버에서 노코 기리 요청이 가능 (아마 IP를 사용하여 이전의 사람들은 그것을 차단했기 때문에) ? 그렇다면 어떻게해야할까요?
이것은 현재 내가 가지고있는 코드입니다.
doc = Nokogiri::HTML(open(URL HERE, 'User-Agent' => 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_0) AppleWebKit/535.2 (KHTML, like Gecko) Chrome/15.0.854.0 Safari/535.2'))
어디에서 403을 얻고 있습니까? 당신이 긁어 모으는 웹 사이트 에서요? – thesecretmaster
실제로 나는 그들이 서버 IP 주소를 차단했다는 인상하에있다. 그 이유는 내가 프록시라고 생각했기 때문이다. –
Mechanise와 프록시를 사용할 수 있습니까? 봐 [여기] (http://stackoverflow.com/questions/18348673/how-do-i-configure-a-ruby-mechanize-agent-to-work-through-the-charles-web-proxy) 또는 [여기 ] (https://gist.github.com/emergent/3983870) –