현재 RSS 피드에 제품 정보를 제공하는 제 3 자와 협력하고 있습니다.Drupal의 RSS 피드 컨텐츠 처리
Drupal 6 사이트는 각 피드 (기본적으로 카테고리)에서 RSS 스토리 (제품)를 가져 와서 결과 노드를 Google의 상점 페이지에 표시합니다. 피드 모듈을 사용합니다.
지금까지,이 시스템은 1 년 넘게 일해 왔습니다.
제 질문은 RSS 피드 콘텐츠를 더 많이 추출하는 방법입니다.
가격이 피드의 일부이지만 사이트의 가격이 데이터베이스의 엔티티가 아니므로 단지 HTML 형식이어야합니다.
사용자 지정 CCK 필드에 가격을 지정하여 물건 등을 나열하는 방법에 좀 더 영리해질 수 있습니다.
드루팔 (Drupal을 테마로 한 것보다 훨씬 뛰어 났지만 PHP/XPath/DOM에 익숙해졌습니다. 따라서 HTML 컨텐트를 연결하고 파싱하는 방법을 알아낼 수 있다면 가능합니다. 나 자신을 먹여라.
어떤 식 으로든 하위 최적화 될 수있는 것을 함께 해킹하기보다는 누구나 내가 이걸 어떻게해야한다고 제안 할 수 있습니까? 맞춤 피드 가져 오기 모듈? 노드를 후 처리하는 Drupal의 다른 훅?
편집 :
우리가 현재 피드 모듈 (6.x의-1.0 베타)를 사용하여 명확히하고, RSS의 제목, 설명, CCK 필드에 날짜 등을지도합니다.
내가하고 싶은 것은 한 단계 더 나아가서 RSS '설명'필드의 HTML 콘텐츠를 구문 분석하는 것입니다.
업데이트 :
http://drupal.org/project/feedapi_scraper
이 그것을 난 후 어떤 종류의를하는 것처럼 보이지만 널리 항상 날 드루팔 모듈과 긴장 좀하게하는, 사용 보이지 않는다. 나는 그것을 줄 것이고 다시보고 할 것이다.
클리브 답변 주셔서 감사합니다. 제 질문에 충분히 명확하지 않았으며 (업데이트 할 예정입니다.) FeedAPI의 후속 프로젝트 인 '피드'를 사용하고 있습니다. 문제는 정의 된 요소를 추출하지 않고 RSS 피드 본문에서 세부 정보를 추출하는 것입니다. – Leo