2

this github project I found for open graph data과 비슷한 웹 사이트에서 일반 메타 태그를 구문 분석 할 수 있도록 도움을 청하고 있습니다. 여기에 demo app이 있습니다.레일에서 메타 태그 구문 분석

기본적으로 사용자가 뉴스 사이트의 URL을 입력하고 제목, 설명 등을 검색하여 사용자가 최대한 적은 작업을 할 수있게하고 싶습니다. 내 자신을 롤백하기 전에 위의 프로젝트와 비슷한 현재 프로젝트/보석이 있는지 궁금합니다. (오픈 그래프와 일반적인 메타 태그가 아닌 경우에만 작동합니다)

열린 그래프 관련 태그가없는 경우에도 facebook's linter도 마찬가지입니다.

답변

2

나는 Nokogiri gem을 권하고 싶습니다. HTML, XML 등의 파서이므로 독자적으로 페이지를 파싱 할 수 있습니다. 이 접근법에 대한 좋은 점은 특정 유스 케이스에 가장 융통성을 제공한다는 것입니다. XPath 또는 CSS3 선택기를 사용하여 표현할 수있는 한 보석 및 헤더 태그를 구문 분석 할 수 있습니다.

+0

그래, 난 등 노코 기리와 Hpricot을 잘 알고있어, 난으로, 더 맞춤형 솔루션에 더 관심이 있었다 모든 사이트가 긁히는 경우 동일한 필드에 대해 정확한 메타 태그를 사용하는지 확실하지 않습니다. – holden