2013-06-02 2 views

답변

3

저는 C#에 대해 많이 알지 못하지만 문제 해결 방법에 대한 일반적인 대답을 드릴 수는 있습니다. RSS 피드 (거의)는 전체 기사가있는 신문/블로그의 웹 사이트에서 호스팅되는 기사에 항상 링크됩니다. 따라서 "RSS 필러"는 웹 사이트 콘텐츠에서 기사의 콘텐츠를 가져 와서 기본적으로 피드에 다시 넣고 사용 가능한 (짧은) 소개를 대체합니다.

는이를 위해 다음을 수행해야합니다

  • 구문 분석/
  • 는 HTML 페이지에서 실제 기사를 찾아 (내가 그렇게하는 C#을 libs와 거기에 많은 확신) RSS/원자 피드를 생성 원본 RSS 피드에 링크되어 있습니다. 실제로 연결된 페이지에는 "전체"RSS 피드 (예 : 웹 사이트 헤더, 탐색 모음, 광고, 설명, 버튼과 같은 페이 스북 등)에 넣지 않으려는 많은 내용이 포함되어 있습니다. 가장 쉬운 방법은 readability입니다 (빠른 Google 수표는 this lib이라고 알려줍니다).

두 가지를 결합하면 목표를 달성 할 수 있습니다.

http://fivefilters.org에서 이러한 도구의 구현을 찾을 수 있으며 이전 버전의 소스 코드는/콘텐츠 전용/http://code.fivefilters.org/full-text-rss/입니다. PHP로 작성되었지만 진행 방법에 대한 대략적인 아이디어를 줄 수 있습니다.

0

Full post rss feed 웹 사이트 에서 부분 RSS 피드를 확대하는 전체 스크립트를 다운로드 할 수 있습니다. - RSS 피드에서 게시물 URL을 가져옵니다.
- 게시 URL의 전체 콘텐츠를 가져 오면 콘텐츠를 가져 오기 위해 말풍선을 사용합니다.
- 콘텐츠를 구문 분석 할 때 템플릿을 사용합니다. 그들은 가장 인기있는 웹 사이트 및 WordPress 테마의 템플릿을 계속 업데이트합니다. 템플릿을 기반으로 html 콘텐츠를 html dom 개체로 구문 분석 한 다음 html dom 개체를 기반으로 콘텐츠를 찾습니다.
- 마지막으로 전체 콘텐츠가 포함 된 RSS 피드를 다시 생성하십시오.

PHP로 작성된 스크립트를 확인하여 나중에 어떤 언어로든 논리를 다시 작성할 수 있습니다.

관련 문제