2011-10-17 3 views
0

현재 RSS 피드에 제품 정보를 제공하는 제 3 자와 협력하고 있습니다.Drupal의 RSS 피드 컨텐츠 처리

Drupal 6 사이트는 각 피드 (기본적으로 카테고리)에서 RSS 스토리 (제품)를 가져 와서 결과 노드를 Google의 상점 페이지에 표시합니다. 피드 모듈을 사용합니다.

지금까지,이 시스템은 1 년 넘게 일해 왔습니다.

제 질문은 RSS 피드 콘텐츠를 더 많이 추출하는 방법입니다.

가격이 피드의 일부이지만 사이트의 가격이 데이터베이스의 엔티티가 아니므로 단지 HTML 형식이어야합니다.

사용자 지정 CCK 필드에 가격을 지정하여 물건 등을 나열하는 방법에 좀 더 영리해질 수 있습니다.

드루팔 (Drupal을 테마로 한 것보다 훨씬 뛰어 났지만 PHP/XPath/DOM에 익숙해졌습니다. 따라서 HTML 컨텐트를 연결하고 파싱하는 방법을 알아낼 수 있다면 가능합니다. 나 자신을 먹여라.

어떤 식 으로든 하위 최적화 될 수있는 것을 함께 해킹하기보다는 누구나 내가 이걸 어떻게해야한다고 제안 할 수 있습니까? 맞춤 피드 가져 오기 모듈? 노드를 후 처리하는 Drupal의 다른 훅?

편집 :

우리가 현재 피드 모듈 (6.x의-1.0 베타)를 사용하여 명확히하고, RSS의 제목, 설명, CCK 필드에 날짜 등을지도합니다.

내가하고 싶은 것은 한 단계 더 나아가서 RSS '설명'필드의 HTML 콘텐츠를 구문 분석하는 것입니다.

업데이트 :

http://drupal.org/project/feedapi_scraper

이 그것을 난 후 어떤 종류의를하는 것처럼 보이지만 널리 항상 날 드루팔 모듈과 긴장 좀하게하는, 사용 보이지 않는다. 나는 그것을 줄 것이고 다시보고 할 것이다.

답변

0

보인다.

0

은 내가 Feed Element Mapper module 모듈 페이지에서

:-) 당신을 위해 모든 것을 할 것입니다 확실 해요 :

부가 기능 모듈 등의 태그 나 같은 피드 항목에 요소를 매핑 FeedAPI에 대한 taxonomy 또는 CCK 필드의 작성자 이름 이러한 매핑은 포인트 앤 클릭으로 구성 할 수 있습니다. 그것은 당신의 소스 피드에서 정보를 추출하는 임의의 XPath의 사용을 지원

http://drupal.org/project/feeds_xpathparser

: 좋은 해결책이 모듈처럼

+0

클리브 답변 주셔서 감사합니다. 제 질문에 충분히 명확하지 않았으며 (업데이트 할 예정입니다.) FeedAPI의 후속 프로젝트 인 '피드'를 사용하고 있습니다. 문제는 정의 된 요소를 추출하지 않고 RSS 피드 본문에서 세부 정보를 추출하는 것입니다. – Leo