2011-11-27 4 views
1

사용자가 블로그 항목을 게시 할 수있는 사이트가 있습니다. 사용자가 직접 작성할 수도 있지만 블로그 사이트에서 기존 항목을 가져 오는 옵션을 제공하고 싶습니다 그들은 이미 가지고 있을지도 모른다 (걱정할 필요가 없다. 사용자 자신 만이 자신의 콘텐츠를 업로드 할 것이다. 그러나 요즘 가장 큰 문제는 각 사용자가 자신의 블로그 모양을 사용자 정의 할 수 있다는 것입니다. 즉, 동일한 사이트 (예 : blogspot 또는 wordpress)를 사용하는 두 명의 사용자조차 완전히 다른 레이아웃을 가질 수 있고 div 이름을 지정할 수 있습니다. "generic"방법 등으로 이러한 항목을 긁어 모으는 방법이 있습니까?다른 레이아웃을 가진 웹 스크 레이 핑 사이트 (사용자의 동의하에)

누구든지 RSS를 제안하기 전에 시도했지만 모든 항목이 내 사이트에 업로드되고 blogspot 만 RSS에 해당 항목을 저장하는 것처럼 보이고 사용자가 업로드 할 항목을 선택하게됩니다. 전체 블로그와 그 의미는 RSS가 더 이상 저장하지 않는 굉장히 후진에서 항목을 선택할 수 있음을 의미합니다.

저는 Ruby on Rails 3을 사용하고 있으며 지금까지 Nokogiri로 근근이 살아가고 있습니다.

+0

Wordpress는 관리 콘솔에 '내보내기'옵션이 있습니다. blogspot은 유사 할 수 있습니다. XML로 내보내므로 Nokogiri를 계속 사용할 수 있습니다. 웹 사이트를 긁어 모으는 것보다 표준화되어야합니다. –

+0

이것은 매우 유용합니다. blogspot에도 있습니다. 그러나 그럼에도 불구하고 가능한 많은 다른 블로그를 지원하고 싶습니다. 또한 스크래핑으로 사용자는 단순히 링크를 복사하여 내 사이트에 붙여 넣기 만하면 나머지는 응용 프로그램에서 처리합니다. – Wilfred

답변

0

웹 스크랩 용 보석은 MECHANIZE GEM입니다. 아주 쉽고 유용합니다. 이것과 약간 jQuery shinanigans는 트릭을해야합니다.

+0

나는 이미 긁어 모으기 위해 Nokogiri 용 보석을 사용하고 있으며 고정 된 레이아웃으로 사이트를 긁어 내는데 아무런 문제가 없지만 사용자는 꽤 쓸모없는 레이아웃을 가질 수 있다는 점이 문제입니다. 가장 좋은 ID는 "entry"라는 ID를 가진 div의 내용과 "entry-title"이라는 ID를 가진 헤더의 제목이며 쉽게 다칠 수 있지만 일부는 다른 구성 요소를 구분하는 데 도움이되는 내용이 없습니다. 내 문제 야. – Wilfred

관련 문제