2011-01-12 3 views
0

HTML 사이트의 여러 페이지를보고 페이지 간의 유사점/유사점을 자동으로 감지하는 프로그램에 대한 임의의 웹 사이트를 잠시 동안 읽은 것을 기억합니다. 어떤 부분이 "상용구 (boilerplate)"템플릿이었고 어떤 부분이 새로운 내용인지를 확인한 다음이를 기반으로 내용에 맞는 부분을 자동으로 불러 냈습니다.HTML 및 기타 텍스트에 대한 템플릿 제거/감지/차이 유틸리티

불행히도, 실제로이 유틸리티에 대한 세부 정보를 기억하지 못했기 때문에 실제로이 정보를 Google에서 찾을 수 있습니다. 그렇다면이 중 어떤 것도 실행했는지, 그 이름을 기억하는지 궁금합니다.

감사합니다.

답변

1

머피의 법칙 (또는 다른 법칙인가?)은 다쳤으며, 포기하고이 질문을 게시 한 순간을 발견했습니다.

http://code.google.com/p/boilerpipe/

감사 : 내가 생각하고이 프로젝트는 이것이다.