SEO를 분석하는 웹 서비스를 구축해야합니다. 이 서비스는 사이트가 얼마나 자주 업데이트되었는지 보여줍니다. 웹 사이트의 HTML에서 게시 된 날짜 또는 업데이트 빈도를 얻는 방법을 알아야합니다.웹 사이트의 업데이트 빈도를 얻는 방법
예를 들어 http://googletesting.blogspot.com/에서 <span>Wednesday, June 04, 2014</span>
태그에서 날짜를 가져올 수 있습니다. 다른 웹 사이트는 동일한 태그 및 날짜 형식을 사용하지 않으므로 해당 날짜를 감지하는 데 동일한 코드를 사용할 수 없습니다. (날짜는 다른 로케일에서 매우 다른 형식을 가질 수 있습니다. 또한 월 이름은 텍스트 또는 숫자로 작성 될 수 있습니다. 가능한 한 많은 날짜를 일치시켜야합니다. 날짜 형식은 게시 날짜가 아니지만 기사의 단어 일뿐입니다 .
내 알고리즘에 대한이 내가 게시 된 후 계산 업데이트 빈도에서 "게시 된 날짜"를 얻기 위해 시도합니다. 주먹 30May 2012에 게시 같은, 두 번째 29May2012에 게시, 세 번째는 그래서 결과를 얻을 수 28May2012 에 게시 이 웹 사이트가 업데이트되었습니다 dairly
결국 각 웹 사이트가 업데이트되는지 알고 싶습니다 :
012 연간 3,516,- 월
- 주간
- 매일
어떻게 안정적으로 어떤 웹 사이트에서이받을 수 있나요?
블로그 만보고있는 경우 RSS 피드는 내가 원하는 것 – hd1