대부분의 가장 큰 뉴스 출처에서 뉴스 기사를 크롤링 할 표준/API가 있는지 아는 사람이 있습니까?크롤링 뉴스 기사
저는 색인을 생성하기 위해 rss를 사용하고 있습니다. 그러나 나는 그것들을 단지 그들의 제목보다 더 많은 자료로 분류하고 싶습니다.
대부분의 가장 큰 뉴스 출처에서 뉴스 기사를 크롤링 할 표준/API가 있는지 아는 사람이 있습니까?크롤링 뉴스 기사
저는 색인을 생성하기 위해 rss를 사용하고 있습니다. 그러나 나는 그것들을 단지 그들의 제목보다 더 많은 자료로 분류하고 싶습니다.
있다 , 당신은 고려할 수 있었다 Newsriver. 구조화 된 온라인 뉴스 기사를 검색하는 것은 매우 최근의 API입니다.
Newsriver은 많은 온라인 뉴스 매체를 다루며 완전히 구성 할 수 있습니다.
서비스 API로 크롤링을 사용의 가장 큰 장점은 더 이상 다음과 같은 측면을 관리 할 필요가 없다는 것입니다 :
정확하게 읽으면 Atom을 의미합니까? 여러 소스로부터 뉴스를 크롤링
대부분의 뉴스 출처는 피드의 주요 기사를 피드에 추가하지 않습니다. – Roch
슬프게도, 안돼 ... 당신은 모든 것을 얻기 위해 자신의 크롤러/스파이더를 써야 할 것입니다. – Trick